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« ODORANT-BINDING » PROTEINES HUMAINES FIXANT PES 
LIGANDS HYDROPHOBES : POLYPEPTIDES ET 
POLYNUCLEOTIDES CODANT LESDITS POLYPEPTIDES ET LEURS 

APPLICATIONS ». 

5 La presente invention conceme la mise en evidence de 

nouvelles proteines humaines flxant les odeurs, ci-apres 
denommees « OBP » (Odorant Binding Proteins) ainsi que leurs 
applications, tant au niveau therapeutique que non therapeutique. 

La presente invention repose sur Tidentification d'une 
10 famille de genes de lipocalines composee de trois genes et de deux 
pseudogenes sur le chromosome humain 9q34 ; les trois genes 
correspondent au gene LCNl deja decrit et a deux nouveaux genes 
faisant Tobjet de la presente invention et denommes hOBPIIa et 
hOBPIIb. De plus, invention repose sur I'attribution de nouvelles 
15 fonctions a des lipocalines humaines deja connues par la mise en 
evidence de nouveaux territoires d'expression. 

Bien qu'un certain nombre d'OBP ait deja ete mis en 
evidence (Pelosi et al, 1996), telle TOBP de rat par exemple (voir 
notamment le brevet EP-0 335 654), les OBP selon la presente 
20 invention sont des OBP humaines qui presentent un tres grand 
nombre d'avantages, comme cela ressortira de la suite du texte, par 
rapport aux proteines murines. 

Ces proteines OBP de la famille des lipocalines ont, pour 
certaines d'entre elles, etc mentionnees indirectement dans le 
25 brevet WO 99 07740, mais leur fonction d'OBP n'a jamais ete 
decrite jusqu'a present ; il en est ainsi egalement des proteines 
LCNl, retinol-binding-protein (RBP) et Apolipoproteine D (ApoD), 
comme cela sera explicite plus completement ci-apres. 



wo 01/12806 




PCT/FROO/02319 



Historiquement, la famille des lipocalines (Pervaiz et Brew, 
1987) a ete definie & partir de la proteine humaine fixant le retinol 
(RBP) et a partir de 3 autres proteines : la 3-lactoglobuline de boeuf, 
ra2n-globuline de rat et I'al-microglobuline humaine. A partir de 
5 ces proteines de reference et en utilisant des homologies de 
sequence, la famille des lipocalines s'est enrichie pour incorporer 
maintenant un grand nombre de proteines, plus d'une centaine, 
aussi bien chez les eucaiyotes que chez les procaryotes (Flower et 
al., 1995, 1996). Cette famille consiste en de petites proteines (160- 
10 190 acides amines) contenant une poche hydrophobe et qui sont 
gfeneralement s6cr6tees (Bocskei et al, 1992 ; Senoo et al, 1990, 
Zeng et al., 1996 ; Miller, 1998), bien que dans certains cas il 
s'agisse de proteines qui restent associees a la membrane (Nagata 
etal, 1991). Chez les vertebres, les identites de sequence entre les 
15 differentes lipocalines toument autour de 20%, toutefois, les 
identites de sequences sont plus importantes pour les proteines 
orthologues, de meme que pour les recents genes paralogues 
decrits (Igarashi et al., 1992 ; Dewald et al., 1992). 

La presente invention conceme les polypeptides isoles OBPII 
20 codes par les deux nouveaux genes humains OBPIIa et OBPIlb 
isoles localises au locus 9q34 ; llnvention conceme egalement les 
sequences polynucleotidiques correspondantes, les ARNm 
correspondants, ainsi que les sequences regulatrices promotrices 
qui determinent le profil d'expression dans les differents tissus et 
25 notamment dans les tissus secreteurs. Ces deux genes cedent pour 
au moins sept polypeptides differents etant donne I'existence 
d'epissage altematif des transcrits. Le gene OBPIIa code pour au 
moins 4 polj^eptides differents denommes OBPIIaa , OBPIIap . 
OBPIUy , OBPIIfls et le gene OBPIlb code pour trois polypeptides 



01/12806 




PCT/FROO/02319 



3 



differents ddnomm^s OBPIIb«, OBPIIbp, OBPIIbs. Meme si un gene 
est principalement exprime, toutes les formes de messagers sont 
retrouvees dans la structure nasale. 

La presente invention a done pour objet un polypeptide isole 
5 comprenant une sequence en amino-acides ayant au moins 90% 
d'identite avec les sequences en amino-acides SEQ ID N''2, SEQ ID 
N»4, SEQ ID N»6, SEQ ID N°8, SEQ ID NnO, SEQ ID N"'12 ou SEQ 
ID N°14 et LCNl, ApoD et REP. 

II doit etre compris que invention conceme les polypeptides 
10 obtenus par purification a partir de sources naturelles ou bien 
obtenus par les techniques recombinantes, comme cela sera decrit 
dans ce qui va suivre; I'invention conceme egalement les 
polypeptides obtenus par synthase chimique qui peuvent alors 
comporter des acides amines non naturels. Dans la presente 
15 description, on utiUsera le terme polypeptide pour designer 
egalement une proteine ou un peptide. 

Par pourcentage d'identite entre les sequences, on entend 
designer le pourcentage d'acides amines identiques entre les 
sequences obtenu avec le meiUeur alignement de sequences 
20 possibles. Ce pourcentage etant purement statistique et les 
differences entre les polypeptides etant reparties au hasard et sur 

toute la longueur. 

La presente invention conceme egalement un polypeptide 
isol6 caractcrise en ce qull comprend un polypeptide choisi parmi : 
25 a) un polypeptide de sequence SEQ ID N''2, SEQ ID N°4, 

SEQ ID N»6, SEQ ID N'8, SEQ ID N»10, SEQ ID N°12 ou SEQ ID 

b) un polypeptide variant de polypeptide de sdquences 
d'acides amines defini en a) ; 
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c) un polypeptide homologue au polypeptide defini en a) ou 
b) et comportant au moins 90 % d'identite avec Icdit polypeptide de 
a); 

d) un fragment d'au moins 15 acides amines consccutifs 
5 d'un polypeptide defini en a), b) ou c) ; 

e) un fragment biologiquement actif d'un pol3T5eptide defini 
en a), b) ou c). 

On entendra par polypeptide variant I'ensemble des 
polypeptides mutes pouvant exister naturellement, en particulier 
10 Chez retre humain, et qui correspondent notamment a des 
troncatures, substitutions, deletions et/ou additions de r6sidus 
d'amino-acides. Les polypeptides variants selon I'invention 
conseivent au moins un domaine de fixation a un ligand 
hydrophobe. 

15 Par polypeptide homologue, on entendra designer les 

polypeptides presentant, par rapport aux polypeptides de sequence 
SEQ ID N°2, SEQ ID N°4, SEQ ID N°6, SEQ ID N°8, SEQ ID N-'IO, 
SEQ ID Nn2 et SEQ ID N^M, certaines modifications comme en 
particulier une deletion, addition ou substitution d'au moins un 

20 acide amine, une troncature, un allongement et/ou une fusion 
chimerique. Parmi les polypeptides homologues, on prefere ceux 
dont la sequence d'acides amines presente au moins 90% 
d'identite, de preference 95 %, de maniere preferee 97 %, et de 
maniere encore pref6ree 99 % d'identite avec les sequences d'acides 

25 amin6s des polypeptides selon I'invention. Dans le cas d'une 
substitution, un ou plusieurs acides amines consecutifs ou non 
consfecutifs, sont remplaces par des « acides amines equivalents ». 
L'expression « acide amin6 equivalent » vise ici a designer tout acide 
amine susceptible d'etre substitue a I'un des acides amines de la 
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Structure de base sans cependant modifier les caracteristiques ou 
propriet6s fonctionnelles essentielles des polypeptides 
correspondants, leurs activitds biologiques, telles par exemple 
I'induction in vivo d'anticorps capables de reconnaltre le 
5 polypeptide dont la sequence d'acides amines est comprise dans la 
sequence d'acides amines SEQ ID N''2, SEQ ID N°4, SEQ ID N°6, 
SEQ ID N°8, SEQ ID N°10, SEQ ID N''12 ou SEQ ID N°14, ou I'un 
de ses fragments. Ces acides amines equivalents peuvent etre 
determines soit en s'appuyant sur leur homologie de structure avec 
10 les acides amines auxquels ils se substituent, soit sur les resultats 
des essais d'activite biologique croisee auxquels les differents 
polypeptides sont susceptibles de donner lieu. A titre d'exemple, on 
mentionnera les possibilites de substitutions susceptibles d'etre 
effectuees sans qu'il en resulte une modification approfondie des 

15 activites biologiques des polypeptides modifies correspondants, les 
remplacements, par exemple, de la leucine par la valine ou 
I'isoleucine, de I'acide aspartique par I'acide glutamique, de la 
glutamine par I'asparagine, de I'arginine par la lysine etc., les 
substitutions inverses etant naturellement envisageables dans les 

20 memes conditions. Ainsi, on peut envisager d'introduire certaines 
modifications comme en particulier une deletion, addition ou 
substitution d'au moins un acide amine au niveau des helices 
alpha de la protcine sans detruire le calice forme par la structure 
composee des feuillets beta ; de la meme maniere, il est possible 

25 d'introduire des amino-acides equivalents qui permettent de 
conserver aux feuillets beta le caractere hydrophobe. II peut 
egalement etre interessant d'introduire des modifications dans la 
sequence des polypeptides de I'invention pour generer des 
polypeptides homologues depourvus de sites proteasiques. 
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Par fragment biologiquement actif, on entendra designer en 
particulier un fragment de sequence d'acides amines de polypeptide 
selon rinvention presentant au moins une des caracteristiques ou 
proprietes fonctionnelles des polj^eptides selon Tinvention, 
5 notamment en ce que : (i) il est capable d'etre reconnu par un 
anticorps specifique d'un polypeptide selon Tinvention ou bien par 
des anticorps produits par des patients au cours d*une reaction 
immunitaire; (ii) il presente au moins Tun des domaines ou regions 
tels que definis ci-apres ; (iii) il est capable de lier un ligand 
10 hydrophobe et notamment des molecules odorantes, de preference 
les pheromones ; (iv) il est capable de lier specifiquement un 
recepteur. 

Par fragment de polypeptide, on entend designer un 
poljrpeptide comportant au minimun 15 acides amines, de 

15 preference 18 acides amines, de maniere preferee 25 et de maniere 
encore preferee 50 acides amines. Les fragments de polypeptide 
selon rinvention obtenus par clivage dudit polypeptide par une 
enzyme proteolytique, par un reactif chimique, ou encore en 
plagant ledit polypeptide dans un environnement tres acide font 

20 egalement partie de rinvention. Lorsque Ton souhaite utiliser une 
sequence de 15, 18, 25 ou de 50 amino-acides, il s'agit bien 
entendu, de preference, des parties correspondant a des epitopes 
fonctionnels des polypeptides precedents, lesquels pourront etre 
integres dans un polypeptide ayant une structure plus longue sous 

25 forme par exemple de proteine de fusion, ceci dependra des 
applications que Ton souhaite de ces polypeptides. 

Selon un mode prefere de realisation, la presente invention 
conceme un polypeptide isole selectionne parmi un polypeptide 
correspondant a la sequence SEQ ID N**2 et denomme OBPIIaa , a la 
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sequence SEQ ID N**4 et denomme OBPIIap , a la sequence SEQ ID 
N**6 et denomme OBPIIay , a la sequence SEQ ID N^^IO et denomme 
OBPIIba, a la sequence SEQ ID N**12 et denomme OBPIIbp . 

Les polypeptides selon Tinvention se caracterisent en ce 
5 qu'ils comportent de preference le domaine Gly-Thr-Trp-Tyr. 

L'invention conceme egalement le polynucleotide isole 
caracterise en ce qull code pour un polypeptide tel que decrit 
precedenmient. Le polynucleotide selon Tinvention est choisi parmi 
le polynucleotide de sequence SEQ ID N° 1, SEQ ID N° 3 , SEQ ID 
10 N*' 5, SEQ ID N^7, SEQ ID N'^Q, SEQ ID N^ll ou SEQ ID N** 13. 

L'invention porte egalement sur un poljniucleotide isole 
caracterise en ce qu'il comprend un pol3mucleotide choisi parmi : 

a) un polynucleotide de sequence SEQ ID N"* 1, SEQ ID N"* 
3 , SEQ ID N** 5, SEQ ID N°7, SEQ ID N"9, SEQ ID N*^ll ou SEQ ID 

15 N** 13 ou dont la sequence est celle de TARN correspondant a la 
sequence SEQ ID N** 1, SEQ ID N** 3 , SEQ ID 5, SEQ ID N°7, 
SEQ ID N°9, SEQ ID Nm ou SEQ ID N° 13 ; 

b) un polynucleotide dont la sequence est complementaire 
de la sequence d'un polynucleotide defini en a), 

20 c) un polynucleotide dont la sequence comporte au moins 

80% d'identite, de preference 90 %, de maniere preferee 95 %, et de 
maniere encore preferee 97 % d'identite avec un poljmucleotide 
defini en a) ou b), 

d) un polynucleotide hybridant dans des conditions de forte 
25 stringence avec une sequence de polynucleotide defini en a), b) ou 

c), 

e) un fragment d'au moins 15 nucleotides consecutifs, de 
preference 21 nucleotides consecutifs, et de maniere preferee 30 
nucleotides consecutifs d'un polynucleotide defini en a), b), c) ou d). 
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Dans la presente description, on entendra designer par 
polynucleotide, oligonucleotide, sequence de poljoiucleotide, 
sequence nucleotidique ou acide nucleique un fragment d'ADN, 
aussi bien un ADN double brin, un ADN simple brin que des 
5 produits de transcription desdits ADN, et/ou un fragment d'ARN, 
lesdits fragments naturels isoles, ou de synthese, comportant ou 
non des nucleotides non naturals, designant un enchainement 
precis de nucleotides, modifies ou non, permettant de definir un 
fragment ou une region d'un acide nucleique. 

10 Par pol3aiucleotide de sequence complementaire, on entend 

designer tout ADN dont les nucleotides sont complementaires de 
ceux de la SEQ ID N" 1, SEQ ID N" 3 , SEQ ID N" 5, SEQ ID N"?, 
SEQ ID N-g, SEQ ID N"! 1, SEQ ID N" 13 ou d\ine partie de la SEQ 
ID N° 1, SEQ ID N" 3 , SEQ ID N» 5, SEQ ID N»7, SEQ ID N»9, SEQ 

15 ID N" 1 1, SEQ ID N" 13 et dont I'orientation est inversee. 

Par pourcentage d'identite au sens de la presente invention, 
on entend un pourcentage de bases identiques entre les 
polynucleotides obtenus apres le meilleur alignement, ce 
pourcentage etant purement statistique et les differences entre les 
20 deux polynucleotides etant reparties au hasard et sur toute leur 
longueur. 

Une hybridation dans des conditions de forte stringence 
signifie au sens de la presente invention, que les conditions de 
temperature et de force ionique sont choisies de telle maniere 
25 qu*elles permettent le maintien de I'hybridation entre deux 
fragments d'ADN complementaires. A titre illustratif, des conditions 
de forte stringence de I'etape dliybridation aux fins de definir les 
fragments polynucleotidiques decrits ci-dessus, sont 
avantageusement les suivantes : 
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Lliybridation ADN-ADN ou ADN-ARN est realisee en deux 
etapes: (1) prehybridation k 42*0 pendant 3 heures en tampon 
phosphate (20 mM, pH 7,5) contenant 5 x SSC (1 x SSC correspond 
a une solution 0,15 M NaCl + 0,015 M citrate de sodium), 50 % de 

5 formamide, 7 % de sodium dodecyl sulfate (SDS), 10 x Denhard's, 5 
% de dextran sulfate et 100 ng/ml d'ADN de sperme de saumon ; 
(2) hybridation proprement dite pendant 20 heures a une 
temperature dependant de la taille de la sonde (i.e. : 42»C, pour une 
sonde de taille > 100 nucleotides) suivie de 2 lavages de 20 minutes 

10 a 20X en 2 X SSC + 2 % SDS, 1 lavage de 20 minutes a 20°C en 
0,1 X SSC + 0,1 % SDS. Le dernier lavage est pratique en 0,1 x SSC 
+ 0,1 % SDS pendant 30 minutes a 60°C pour une sonde de taille > 
100 nucleotides. Les conditions dliybridation de forte stringence 
decrites ci-avant pour un polynucleotide de taille definie, seront 

15 adaptees par I'homme du mdtier pour des oUgonucleotides de taiUe 
plus grande ou plus petite, selon I'enseignement de Sambrook et 
al.( 1989). 

Avantageusement, un fragment nucleotidique repondant a la 
definition precedente aura au moins 15 nucleotides consecutifs, de 

20 preference au moins 21 nucleotides, et encore plus 
preferentiellement au moins 30 nucleotides consecutifs de la 
sequence dont il est issu. 

Selon un mode de realisation de I'invention, le 
polynucleotide selon I'invention se caract6rise en ce qu*il est 

25 marque directement ou indirectement par un compost radioactif ou 
un compose non radioactif. Le polynucleotide selon I'invention est 
utilise en tant qu'amorce pour I'amplification ou la polymerisation 
de sequences nucleiques ; I'invention porte egalement sur 
I'utilisation d'un polynucleotide selon I'invention en tant que sonde 
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pour la detection de sequences nucleiques. Selon I'lnvention, les 
fragments de polynucleotides pouvant etre utiUses comma sonde ou 
comme amorce dans des proc6des de detection, d'identification de 
dosage ou d'amplification de sequence nucleique, presenteront une 
taille minimale de 9 bases, de preference de 18 bases, et de maniere 
plus prefcree 36 bases. Enfm, ^invention porte sur IMtilisation d'un 
polynucleotide selon I'invention en tant que oligonucleotide sens ou 
antisens pour contr61er I'expression du produit proteique 
correspondant en I'occurence un polypeptide selon I'invention. 

Les sequences de polynucleotides selon I'invention non 
marquees peuvent etre utilisees directement comme sonde, amorce 
ou oligonucleotide; cependant les sequences utilisees sont 
generalement marquees pour obtenir des sequences utilisables 
pour de nombreuses applications. Le marquage des amorces, des 
sondes, des oligonucleotides selon I'invention est realise par des 
elements radioactifs ou par des molecules non radioactives ; parmi 
les isotopes radioactifs utilises, on peut citer le 32p, le asp, 353, le 
m ou le 1251. Les entites non radioactives sont selectionnees panni 
les ligands tels la biotine, I'avidine, la streptavidine, la dio^genine, 
les haptenes. les colorants, les agents luminescents tels que les 
agents radioluminescents, chemiluminescents, bioluminescents, 
fluorescents, phosphorescents. 

L'invention comprend egalement une methode de detection 
et/ou de dosage d'acide nucldique selon I'invention. dans un 
echantillon biologique, caracterise en ce qu'il comportc les etapes 
suivantes: (i) disolement de I'ADN a partir de rechantillon 
biologique a analyser, ou obtention dMn ADNc a partir de I'ARN de 
rechantillon biologique ; (ii) d'amplification specifique de I'ADN 



wo 01/12806 




PCT/FROO/02319 



11 



codant pour le polypeptide selon rinvention a Taide d'amorces ; (iii) 
d'analyse des produits d*amplification. 

L'invention comprend en outre un necessaire pour la 
detection et/ou le dosage d'un acide nucleique selon rinvention, 
5 dans un echantillon biologique, caracterise en ce qu'il comprend les 
elements suivants : (i) un couple d'amorces nucleiques selon 
rinvention, (ii) les reactifs necessaires pour effectuer une reaction 
d'amplification d'ADN, et eventuellement (iii) un composant 
permettant de verifier la sequence du fragment amplifie, plus 
10 particulierement une sonde selon rinvention. 

L'invention comprend aussi une methode de detection et/ou 
de dosage d'acide nucleique selon rinvention, dans un echantillon 
biologique, caracterise en ce qu'il comporte les etapes suivantes : (i) 
de mise en contact d*une sonde selon rinvention avec un 
15 echantillon biologique ; (ii) de detection et/ou de dosage de I'hybride 
forme entre ladite sonde et I'ADN de rechantillon biologique. 

L'invention comprend egalement un necessaire pour la 
detection et/ou le dosage d'acide nucleique selon rinvention, dans 
un echantillon biologique, caracterise en ce qu'il comprend les 
20 elements suivants : (i) une sonde selon rinvention, (ii) les reactifs 
necessaires a la mise en oeuvre d\ine reaction dTiybridation, et le 
cas echeant, (iii) un couple d'amorces selon rinvention, ainsi que 
les reactifs necessaires a une reaction d'amplification de I'ADN. 

L'invention conceme particulierement les procedes selon 
25 rinvention et decrits ci-dessus, pour la detection et le diagnostic de 
cellules dbrigine cancereuse et principalement cancers du sein, de 
Tuterus, de rovaire, de la prostate et du poumon. 

Les polynucleotides selon rinvention peuvent ainsi etre 
utilises comme amorce et/ou sonde dans des procedes mettant en 
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oeuvre notamment la technique PGR (reaction en chaine a la 
polynierase)(Erlich, 1989 ; Innis et cd., 1990, et Rolfs et al, 1991). 
Cette technique ndcessite le choix de paires d'amorces 
oligonucleotidiques encadrant le fragment qui doit etre amplifle. On 
5 peut, par exemple, se referer a la technique decrite dans le brevet 
americain U.S. N" 4 683 202. Les fragments amplifies peuvent etre 
identifies, par exemple apres une electrophorese en gel d'agarose 
ou de polyaciylamide, ou apres une technique chromatographique 
comme la filtration sur gel ou la chromatographic echangeuse 

10 d'ions. La specificite de I'amplification peut etre controlee par 
hybridation moleculaire en utilisant comme sonde les sequences 
nucleotidiques de polynucleotides de Tinvention, de plasmides 
contenant ces sequences ou leurs produits d'amplification. Les 
fragments nucl6otidiques amplifies peuvent etre utilises comme 

15 reactifs dans des reactions dliybridation afin de mettre en evidence 
la presence, dans un echantillon biologique, d*un acide nucleique 
cible de sequence complementaire a celle desdits fragments 
nucleotidiques amplifies. 

L'invention vise egalement les fragments nucleotidiques 

20 susceptibles d'etre obtenus par amplification a I'aide d'amorces 
selon l'invention. 

D'autres techniques d'amplification de I'acide nucleique 
cible peuvent etre avantageusement employees comme alternative k 
la PGR (PCR-like) a I'aide de couple d'amorces de sequences 

25 nucleotidiques selon Invention. Par PGR-like on entendra designer 
toutes les methodes mettant en oeuvre des reproductions directes 
ou indirectes des sequences d'acides nucleiques, ou bien dans 
lesquelles les systemes de marquage ont ete amplifies, ces 
techniques sont bien entendu connues, en general il s'agit de 
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ramplification de I'ADN par une polymerase ; lorsque rechantillon 
d'origine est un ARN il convient prealablement d'effcctuer une 
transcription inverse. II existe actuellement de trds nombreux 
precedes permettant cette amplification, comme par exemple la 
5 technique SDA (Strand Displacement Amplification) ou technique 
d'amplification a deplacement de brin (Walker et cd., 1992), la 
technique TAS (Transcription-based Amplification System) decrite 
par Kwoh et al en 1989, la technique 3SR (Self-Sustained 
Sequence Replication) decrite par Guatelli et al en 1990, la 

10 technique NASBA (Nucleic Acid Sequence Based Amplification) 
decrite par Kievitis et al. en 1991, la technique TMA (Transcription 
Mediated Amplification), la technique LCR (Ligase Chain Reaction) 
decrite par Landegren et al. en 1988 et perfectionnee par Barany et 
al. en 1991, qui emploie une ligase thermostable, la technique de 

15 RCR (Repair Chain Reaction) decrite par Segev en 1992, la 
technique CPR (Cycling Probe Reaction) ddcrite par Duck et al. en 
1990, la technique d'amplification a la Q-beta-replicase decrite par 
Miele et al en 1983 et perfectionnde notamment par Chu et al. en 
1986 et Lizardi et al. en 1988, puis par Burg et al. (1996) ainsi que 

20 par Stone et al. (1996). 

Dans le cas ou le polynucleotide cible a detecter est un ARN, 
par exemple un ARNm, on utilisera avantageusement, 
prealablement a la mise en oeuvre d'une reaction d'amplification a 
Taide des amorces selon I'invention ou a la mise en oeuvre d*un 

25 procede de detection & I'aide des sondes de I'invention, une enzyme 
de type transcriptase inverse aiin d'obtenir un ADNc a partir de 
I'ARN contenu dans I'echantillon biologique. L'ADNc obtenu servira 
alors de cible pour les amorces ou les sondes mises en oeuvre dans 
le procede d'amplification ou de detection selon I'invention. 
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Les sondes nucleotidiques selon Hnvention hybrident 
specifiquement avec une molecule d'ADN ou d'ARN de 
polynucleotide selon Tinvention, plus particulierement avec les 
sequences SEQ ID N** 1, SEQ ID N'* 3 , SEQ ID N° 5, SEQ ID N^7, 
5 SEQ ID N*^9, SEQ ID N^^ll et SEQ ID 13, dans des conditions 
dliybridation de forte stringence telles que donnees sous forme 
d'exemple precedemment. 

La technique dTiybridation peut etre realisee de manieres 
diverses (Matthews et al, 1988), La methode la plus generale 

10 consiste a immobiliser Tacide nucleique extrait des cellules de 
differents tissus ou de cellules en culture sur un support (tel que la 
nitrocellulose, le nylon, le polystyrene) et a incuber, dans des 
conditions bien definies, Tacide nucleique cible immobilise avec la 
sonde. Apres lliybridation, Texces de sonde est elimine et les 

15 molecules hybrides formees sont detectees par la methode 
appropriee (mesure de la radioactivite, de la fluorescence ou de 
Tactivite enzymatique liee a la sonde), 

Selon un autre mode de mise en oeuvre des sondes 
nucleiques selon Tinvention, ces demieres peuvent etre utilisees 

20 comme sonde de capture. Dans ce cas, une sonde, dite « sonde de 
capture », est immobilisee sur un support et sert a capturer par 
hybridation specifique Tacide nucleique cible obtenu a partir de 
Techantillon biologique a tester et Tacide nucleique cible est ensuite 
detecte grace a une seconde sonde, dite « sonde de detection », 

25 marquee par un element facilement detectable. 

Dans un mode prefere de realisation, Tinvention comprend 
Tutilisation d'un oligonucleotide sens ou antisens pour controler 
Texpression du produit proteique correspondant, Parmi les 
fragments d'acides nucleiques interessants, il faut citer en 
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particulier les oligonucleotides anti-sens, c'est-a-dire dont la 
structure assure, par hybridation avec la sequence cible, une 
inhibition de Texpression du produit correspondant. II faut 
egalement citer les oligonucleotides sens qui, par interaction avec 
5 des proteines impliquees dans la regulation de Texpression du 
produit correspondant, induiront soit une inhibition, soit une 
activation de cette expression. Les oligonucleotides selon Tinvention 
presentent une taille minimale de 9 bases, de preference de 18 
bases, et de maniere plus preferee 36 bases. 

10 L'invention conceme un vecteur recombinant de clonage 

d'un polynucleotide selon Tinvention et/ou d'expression d'un 
polypeptide selon Tinvention caracterise en ce qu'il contient un 
poljniucleotide selon Tinvention tel que precedemment decrit. Le 
vecteur selon invention est caracterise en ce qu'il comporte les 

15 elements permettant Texpression desdites sequences dans une 
cellule hote et eventuellement la secretion desdites sequences hors 
de la cellule hote. Par « vecteur d'expression », on entend aussi bien 
des vecteurs d'expression a replication autonome du type plasmide 
que des systemes destines a assurer Tintegration dans les cellules, 

20 mais ces vecteurs d 'expression pourront etre egalement des 
vecteurs d'expression de type viral ou bien meme, lorsque Ton 
souhaite realiser par exemple de la therapie genique, de TADN nu. 
Parmi les vecteurs viraux, on prefere ceux derives de Tadenovirus, 
du virus associe a Tadenovirus (AAV), de retrovirus, des lentivirus, 

25 et de preference les derives de HIV, des poxvirus, du virus de 
ITierpes pour I'expression en systeme eucaiyote. Parmi les vecteurs 
non viraux, on prefere les poljmucleotides nus tels que I'ADN nu ou 
TARN nu selon la technique developpee par la societe VICAL, les 
chromosomes artificiels de levure (YAC, yeast artificial 
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chromosome) pour Texpression dans la levure, les chromosomes 
artiiiciels de souris (MAC, mouse artificial chromosome) pour 
Texpression dans les cellules murines et de maniere prefere les 
chromosomes artiiiciels dliomme (HAC, human artificial 
5 chromosome) pour Texpression dans les cellules humaines. 

Selon un mode particulier de realisation, le vecteur selon 
rinvention comporte des elements de controle de Texpression des 
polypeptides ; ces elements de controle sont choisis de preference 
parmi (i) la sequence promotrice du gene hOBPIIa selon 

10 rinvention qui correspond a la sequence SEQ ID N°15 et/ou parmi 
la sequence promotrice du gene hOBPIIb selon rinvention qui 
correspondant a la sequence SEQ ID N^'ie ; (ii) un poljniucleotide 
dont la sequence est complementaire a la sequence SEQ ID N"* 15 et 
SEQ ID N** 16 ; (iii) un pol3niucleotide dont la sequence comporte au 

15 moins 80% d'identite avec un polynucleotide defini en (i) ou (ii) ; (iv) 
un polynucleotide hybridant dans des conditions de forte 
stringence avec la sequence de polynucleotide defmie en (i), (ii), (iii). 
Les outils informatiques a la disposition de ITiomme du metier lui 
permettent aisement d'identifier les boites regulatrices promotrices 

20 necessaires et sufiisantes au controle de Texpression genique, 
notamment les boites TATA, CCAAT, GC, ainsi que les sequences 
regulatrices stimulatrices (« enhancer ») ou inhibitrices (« silencers ») 
qui controlent en CIS Texpression des genes selon rinvention ; 
parmi ces sequences regulatrices, il convient de citer HRE, MRE, 

25 CRE. 

II est egalement dans Tetendue de rinvention d'utiliser les 
elements ci-dessus definis et choisis parmi la sequence SEQ ID 
N°15 et/ou SEQ ID N''16 pour controler Texpression de 
polypeptides heterologues autres que ceux de rinvention et 
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notamment pour dinger Texpression de polypeptides heterologues 
dans les types cellulaires dans lesquels les polypeptides selon 
Tinvention s'expriment normalement. 

L'invention comprend en outre les cellules hotes, 

5 notamment les cellules eucaiyotes et procaryotes, caractdrisdes en 
ce qu'elles sont transformees par les vecteurs selon l'invention. De 
preference, les cellules hdtes sont transformees dans des conditions 
permettant I'expression d'un polypeptide recombinant selon 
l'invention. L'hote cellulaire peut etre choisi parmi les cellules 

10 bacteriennes mais egalement parmi les cellules de levure, de meme 
que peumi les cellules vegetales et animales ; de preference, l'hote 
cellulaire est une cellule de mammiferes (Edwards et Aruffo, 1993), 
mais dgalement une cellule dinsectes dans laquelle on peut utiliser 
des procedes mettant en oeuvre des baculovirus par exemple 

15 (Luckow, 1993). Ces cellules peuvent etre obtenues par 
I'introduction dans des cellules botes d*une sequence nucleotidique 
insdree dans un vecteur tel que defini ci-dessus, puis la mise en 
culture desdites cellules dans des conditions permettant la 
replication et/ou I'expression de la sequence nucleotidique 

20 transfectee. 

Selon un mode particulier de realisation, l'invention porte 
egalement sur un animal ou une plante tran^enique qui comporte 
des cellules botes selon l*invention. 

L'invention conceme dgalement une methode de preparation 

25 d*un polypeptide caracterise en ce qu'il met en oeuvre un vecteur 
selon l'invention. Plus particulierement, l'invention porte sur une 
metbode de preparation d'un polypeptide recombinant caracterise 
en ce que Ton cultive des cellules transformees selon l'invention 
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dans des conditions permettant I'expression dudit polypeptide 
recombinant et que I'on rdcupere ledit polypeptide recombinant. 

Le polypeptide selon I'invention est susceptible d'etre obtenu 
selon un procedd de Tinvention et selon les techniques de 
production de polypeptides recombinants connues de lliomme du 
metier. La presente invention conceme done le pol3rpeptide 
recombinant susceptible d'etre obtenu par la methode ci-dessus 
presentee. Dans ce cas, la sequence d'acide nucleique utilisee est 
placee sous le controle de signaux permettant son expression dans 
un bote cellulaire. Un systeme efficace de production d'un 
polypeptide recombinant necessite de disposer d'un vecteur, par 
exemple d'origine plasmidique ou virale, et d'une ceUule h6te 
compatible. Le vecteur doit comporter un promoteur, des signaux 
d'initiation et de terminaison de la traduction, ainsi que des regions 
appropriees de regulation de la transcription. II doit pouvoir etre 
maintenu de fa^on stable dans la cellule et peut eventuellement 
posseder des signaux particuliers specifiant la secretion du 
polypeptide traduit. Ces differents signaux de controle sont choisis 
en fonction de lliote cellulaire utilise. A cet effet, les sequences 
d'acide nucleique selon I'invention peuvent etre inserees dans des 
vecteurs a replication autonome au scin de I'hote choisi, ou des 
vecteurs integratifs de I'hote choisi. De tels vecteurs seront 
prepares selon les methodes couramment utiUsees par I'homme du 
metier, et les clones en resultant peuvent etre introduits dans un 
hote approprie par des methodes standards telles par exemple la 
transfection par precipitation au phosphate de calcium, la 
lipofection, I'electroporation, le choc thermique. 

Les pol3rpeptides recombinants obtenus comme indique ci- 
dessus, peuvent aussi bien se presenter sous forme glycosylee que 
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non glycosylee et peuvent presenter ou non la structure tertiaire 
naturelle. 

Les polypeptides obtenus par synthese chimique et pouvant 
comporter des acides amines non naturels correspondant auxdits 

5 pol5rpeptides recombinants, sont egalement compris dans 
rinvention. Les peptides selon Tinvention peuvent egalement etre 
prepares par les techniques classiques, dans le domaine de la 
synthese des peptides. Cette synthese peut etre realisee en solution 
homogene ou en phase solide. 

10 Les procedes de purification de polypeptide recombinant 

utilises sont connus de lliomme du metier. Le polypeptide 
recombinant peut 6tre purifi6 a partir de lysats et extraits 
cellulaires, du sumageant du milieu de culture, par des methodes 
utilisees individuellement ou en combinaison, telles que le 

15 fractionnement, les methodes de chromatographic, les techniques 
d'immuno-affmite k Taide d'anticorps mono- ou polyclonaux 
specifiques, etc. Une variante preferee consiste a produire un 
pol3rpeptide recombinant fusionne a une proteine « porteuse » 
(proteine chimere). L'avantage de ce systeme est qu'il permet une 

20 stabilisation et une diminution de la proteolyse du produit 
recombinant, une augmentation de la solubilite au cours de la 
renaturation in vitro et/ou une simplification de la purification 
lorsque le partenaire de fusion possdde une affinitd pour un ligand 
sp^cifique. 

25 La presente invention conceme l*utilisation d'un polypeptide 

choisi parmi un polypeptide hOBPIIa et hOBPIIb selon I'invention 
ou I'un de leur fragment et parmi LCNl, la « retinol binding 
protein » (RBP) et I'apolipoproteine D (ApoD) comme proteine de 
liaison a un ligand hydrophobe, de preference une molecule 
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odorante. En effet, outre les polypeptides OBPII mentionnes 
precedemment, la fonction OBP des lipocalines LCNl, RBP et ApoD 
n'a jamais et€ suggeree. En effet, si la presence de LCNl dans le 
mucus nasal a ete decrite (Redl et al., 1992), c'est en fait une autre 
fonction qui lui a ete attribuee, a savoir une fonction d'anti- 
prot6ase, alors que la fonction principale de la proteine LCNl 
semble bien etre le transport de ligands hydrophobes, d'ailleurs les 
essais realises dans le cadre de la presente invention avec une 
proteine LCNl recombinante n'ont pas permis de mettre en 
evidence une activite anti-protease. U en va de meme pour la 
« retinol- binding protein » et I'apoUpoproteine D qui n'ont jamais 
ete presentees comme ayant une fonction OBP. 

La presente invention conceme egalement I'utilisation d'un 
polypeptide selon I'invention ou I'un de ses fragments, LCNl, RBP 
15 et I'apoUpoproteine D comme inhibiteur competitif, comme agoniste 
ou antagoniste des recepteurs cellulalres aux lipocalines. 
L'utiUsation d'inhibiteur de liaison des lipocalines a leur recepteur 
peut etre utilisee dans une strategic anti-cancereuse ; en effet, un 
certain nombre de tumeurs sont hormono-dependantes : ainsi les 
20 tumeurs du sein sont sensibles aux steroides ; ces steroides etant 
transportes par les lipocalines, il est dans I'etendue de I'invention 
de foumir des inhibiteurs de liaison aux polypeptides selon 
I'invention et LCNl, OBP ou APO-D pour eviter la fixation des 
hormones steroides au niveau des recepteurs des ceUules 
25 tumorales. 

L'invention conceme egalement un anticorps monoclonal ou 
polyclonal et ses fragments, caracterises en ce qu'ils lient 
specifiquement un polypeptide selon I'invention. Les anticorps 
chimeriques, les anticorps humanises et les anticorps simple 
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chaine font egalement partie de Tinvention. Les fragments 
d'anticorps selon Tinvention sont de preference des fragments Fab 
ou F(ab02. 

Les polypeptides selon Tinvention permettent de preparer 
5 des anticorps monoclonaux ou polyclonaux. Les anticorps 
monoclonaux pourront avantageusement etre prepares a partir 
dTiybridomes selon la technique decrite par Kohler et Milstein en 
1975. Les anticorps polyclonaux pourront etre prepares, par 
exemple par immunisation d'un animal, en particulier une souris, 

10 avec un polypeptide selon Tinvention associe a un adjuvant de la 
reponse immunitaire, puis purification des anticorps specifiques 
contenus dans le serum des animaux immunises sur une colonne 
d'affinite sur laquelle a prealablement ete fixe le polypeptide ayant 
servi d'antigene. Les anticorps polyclonaux selon I'invention 

15 peuvent aussi etre prepares par purification sur une colonne 
d'affinite, sur laquelle a prealablement ete immobilise un 
polypeptide selon Tinvention. 

L'invention porte egalement sur un anticorps monoclonal 
specifique d'un polypeptide selon Tinvention et capable d'inhiber 

20 interaction entre ledit polypeptide et le recepteur cellulaire sur 
lequel se lie specifiquement ledit polypeptide. Selon un autre mode 
de realisation, Tanticorps monoclonal selon Tinvention est capable 
d'inhiber I'interaction entre ledit polypeptide et ses ligands 
hydrophobes, de preference les molecules odorantes et de maniere 

25 preferee les pheromones avec lesquelles ledit polypeptide se lie. 

Les anticorps de Tinvention pourront egalement etre 
marques de la meme maniere que decrit precedemment pour les 
sondes nucleiques de I'invention et de maniere preferee avec un 
marquage de type enzymatique, fluorescent ou radioactif. De tels 



wo 01/12806 



PCT/FROO/02319 

22 



anticorps marques pourront etre utilises pour la detection de ces 
polypeptides dans un echantillon biologique. De preference, 
I'echantillon biologique est constitue par un fluide par exemple du 
s6rum, du sang ou des biopsies humalnes. lis constituent ainsi un 
5 moyen d*analyse de Pexpression de poljrpeptide selon I'invention, 
par exemple par immunofluorescence, marquage a I'or, 
immunoconjugues enzymatiques. 

Plus generalement, les anticorps de I'invention peuvent etre 
avantageusement mis en oeuvre dans toute situation ou 

10 Fexpression d*un polypeptide selon I'invention doit €tre observee, et 
plus particulierement en immunocytochimie, en 
immunohistochimie ou dans des experiences de « western 
blotting., dans les techniques ELISA et RIA. n est ainsi dans 
I'etendue de I'invention de foumir une methode de detection et/ou 

15 de dosage d*un polypeptide selon I'invention, dans un echantillon 
biologique, caracterise en ce qu'il comprend les etapes suivantes de 
mise en contact de I'echantillon biologique avec des anticorps selon 
I'invention puis demise en evidence du complexe antigSne- 
anticorps forme. 

20 Entre egalement dans le cadre de I'invention, un n^cessaire 

pour la detection et/ou le dosage d*un polypeptide selon I'invention 
dans un echantillon biologique, caracterise en ce qu'il comprend les 
elements suivants : (i) un anticorps monoclonal ou polyclonal tel 
que decrit precedemment ; (ii) le cas echeant, les reactifs pour la 

25 constitution du milieu propice a la reaction immunologique ; (iii) les 
reactifs permettant la detection des complexes antigene-anticorps 
produits par la reaction immunologique. Ce necessaire est 
notamment utile a la realisation d'experiences de Western 
Blotting et aux e3q)eriences d'immunoprecipitation. 
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Les hOBPII selon la presente invention peuvent etre utilisees 
dans de nombreuses applications. 

Les premieres applications des OBP resident dans le 
contrSle des odeurs ; ces applications concement essentiellement 
5 ITiygiene corporelle (parfumerie, cosmetologie, pharmacie) ou 
collective. 

EUes peuvent etre utilisees dans un procede pour controler 
la volatilisation d'une odeur ; un tel procede se caracterise en ce 
qu'il comprend une etape de liaison de ladite odeur avec un 

10 polypeptide selon Tinvention ou avec les proteines LCNl, RBP ou 
Tapolipoproteine D. 

II est egalement possible de fixer Todeur sur un support 
solide en utilisant une OBPII selon Tinvention attachee audit 
support, cette fixation pouvant etre aussi bien une fixation 

15 covalente que non covalente, par exemple par adsorption ou par 
des fixations de type avidine-biotine, si cela est necessaire. Dans 
ces conditions, on obtient un support parfume retenant les odeurs 
plus longtemps, liberant progressivement les odeurs et pouvant etre 
utilise aussi bien dans le domaine cosmetique que dans le domaine 

20 des produits d'entretiens en general. Les supports utilises pourront 
etre des supports de type plaque ou de type bille par exemple. Bien 
entendu, les OBPII selon la presente invention seront plus 
particulierement utilisables dans Tindustrie de la parfumerie et de 
la cosmetique ou les OBP seront utilisees sous forme d*un melange 

25 liquide destine a controler la volatilisation des odeurs apres que la 
composition ait ete repandue sur la peau humaine. Ceci permet de 
prolonger la « tenue » des parfums ou d'entrer dans la composition 
des deodorants corporels notamment. Bien entendu, le terme 
« parfum » englobe de fagon generale les melanges connus en 



wo 01/12806 




PCT/FROO/02319 



24 



parfumerie, a base d'alcool ou sous forme aqueuse, et contenant 
notamment des huiles essentielles. Le polypeptide selon Tinvention 
peut egalement entrer dans la composition de cremes a base de 
retinol en tant qu'agent de transport et de protection dudit retinol 
5 pour des applications cosmetologiques et notamment pour prevenir, 
effacer et traiter les rides, les ridules de la peau, lutter contre le 
relachement cutane et/ou sous-cutane. 

Parmi les applications concemant ITiygiene collective, le 
procede selon Tinvention peut etre utilise dans un dispositif visant 
10 a desodoriser les locaux tels par exemple les animaleries, les 
etables, Un tel dispositif peut egalement etre envisage pour 
desodorise le flux d'air entrant dans un appareil a air conditionne ; 
un tel dispositif serait tres utile dans les zones geographiques 
polluees. 

15 L'invention conceme egalement un procede de criblage de 

molecule, de preference les odeurs ou saveurs qui comprend de 
passer la molecule sur un substrat qui comprend un polypeptide 
selon invention ou, LCNl, RBP et Tapolipoproteine D lie audit 
substrat, ledit polypeptide liant ladite odeur ou saveur et de 

20 recuperer ladite odeur ou saveur depuis le polypeptide si 
necessaire. Les OBP selon Tinvention pourraient ainsi permettre 
risolement d'odeurs ou de parfums en les fixant sur un support tel 
que decrit precedemment mais qui, dans ce cas, pourra etre par 
exemple une colonne de chromatographic, en faisant passer sur 

25 celle-ci le produit sur lequel on souhaite capter les odeurs. II est 
bien entendu possible, toujours dans ce meme type d'application, 
d'effectiier une analyse d'un parfum complexe en utilisant les 
differences de retention des differents produits par les OBP. 
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Le precede d'isolement decrit precedemment peut egalement 
etxe utilise pour separer des « odeurs » particulieres, notamment les 
pheromones humaines. 

Les hOBPII selon la presente invention peuvent etre utilisees 
5 pour des applications agro-alimentaires ou industrielles. 

Les OBP selon la presente invention de part leurs 
caracteristiques peuvent permettre de solubiliser certaines 
molecules lipophiles en les associant avec lesdits OBP. Ainsi les 
polypeptides selon Tinvention peuvent etre utilises en combinaison 
10 avec des acides gras alimentaires a titre d'additif alimentaire. La 
presente invention conceme un precede pour solubiliser des 
molecules lipophiles caracterise en ce qu'il comprend la liaison de 
ladite molecule lipophile a un potypeptide selon Tinvention, a LCNl, 
RBP ou a TapoD. 

15 Les OBPII, de meme que LCNl, RBP et ApoD sont 

susceptibles d'etre impliquees dans le transport des acides gras et 
dans les mecanismes biologiques permettant la detection de la 
charge en acides gras de la ration alimentaire, au niveau buccal 
notamment, Llnvention conceme done egalement Tutilisation des 

20 polypeptides precedents en association avec des acides gras pour 
diminuer la consommation d'acides gras, notamment dans les 
hyperlipidemies ou les obesites. Les polypeptides precedents 
peuvent dont etre utilises pour le traitement des hyperlipidemies et 
de Tobesite. En effet, ces proteines participent a la detection de la 

25 teneur en acides gras dans la prise alimentaire (Gilbertson, 1998), 
un exces de ces proteines doit conduire a leurrer le systeme 
physiologique detectant la charge en gras d'une ration alimentaire. 
Ainsi, une portion alimentaire pauvre en graisse mais 
supplementee en OBP ou ApoD ou RBP ou LCNl prealablement 
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chargees en acide gras, sera faussement identifiee comme riche en 
graisse. 

Une autre application est de complementer un lait non 
matemel avec un ou plusieurs des polypeptides decrits 
5 precedemment. 

Les OBP selon la presente invention peuvent etre utilisees en 
therapie preventive et curative. 

Ainsi, Tabsence de detection de ce type de proteines dans un 
prelevement biologique en utilisant un anticorps, une amorce, une 
10 sonde selon Tinvention pourrait etre un element de diagnostic 
des anosmies. 

De meme, il est possible de prevoir la detection des anticorps 
anti'OBPII dans un echantillon biologique d'origine humaine, la 
presence ou le dosage de ces anticorps pourrait etre en rapport 

15 avec certains types d'allergies, notamment chez les asthmatiques. 
Dans ce cas, il pourrait etre possible de traiter ce type d 'allergic par 
administration de fragments de pol3rpeptides tels que decrits, ce qui 
diminuerait les reactions immunitaires aux allergies extemes. 
L'invention conceme done un precede de detection d'anticorps 

20 dirige contre les OBPII humaines (hOBPII) dans le serum humain 
de patient allergique et/ou asthmatique en utilisant un polypeptide 
hOBPII selon invention. 

Selon un autre mode de realisation, Tinvention conceme un 
precede de detection d'anticorps dirige contre les OBPII humaines 

25 (hOBPII) dans un fluide biologique de patient atteint d'un cancer, et 
notamment du cancer de la prostate et/ou du cancer du sein et/ou 
du cancer de l\iterus et/ou de Tovaire et/ou du poumon. En effet, 
les proteines selon Tinvention sont sur-exprimees dans les tumeurs 
et notamment dans le cancer de la prostate (US 5804368, WO 97 
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10503, CS 84 02898, CS 83 02012, CS 82 08506, CS 82 08215), le 
caacer du sein (Stoecz et Gould, 1995 ; Simard et ol., 1992), le 
cancer de 1*016018, le cancer de Tovaire, le cancer du poumon. 

Les OBP selon la presente invention peuvent egalement etre 
5 utilisees dans des compositions pharmaceutiques, ceci notamment 
afin de vectoriser certaines drogues. 

En effet, les lipocalines sont utilisees par les mammiferes 
pour transporter des molecules hydrophobes au sein de fluides 
biologiques. II semble meme que ce soit les transporteurs naturels 

10 des xenobiotiques in vivo. Pour exemple, une surcharge 
experimentale en xenobiotiques cree chez le rat male des tumeurs 
au niveau du tube contoume proximal (TCP) du nephron (Borghoff 
et al., 1990). En effet, les proteines MUP, seulement produites chez 
le rat male, sont reabsorbees par les cellules TCP ; apres 

15 degradation lysosomiale, les proteines MUP liberent les 
xenobiotiques qu'elles transportaient. Ceux-ci s'accumulent dans 
ces cellules et les conduisent vers une voie tumorale par 
mutagenese. Les lipocalines semblent done etre la structure ideale 
pour piegeren leur calice une molecule utilisee comme 

20 medicament, evitant ainsi une distribution generale de celui-ci. 
Ainsi, G. Beste et a/.(1999) et la demande WO 99 16873 decrivent 
une strategic de mutagenese et de criblage permettant d'identifier 
des variants d*une lipocaline ayant une affinite optimale pour un 
ligand donne. II est done possible de creer une « cage a 

25 medicament » hautement specifique. 

La presente invention conceme done un polypeptide selon 
rinvention en tant qu'agent de ciblage de compose pharmaceutique. 
Par agent de ciblage, on entend designer les polypeptides de 
rinvention capables d'assurer le transport et la liberation du ligand 
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auxquels ils sont lies au niveau de certains tissus ou cellules cibles 
qui possedent a leur surface des recepteurs auxdits polypeptides. 
Ainsi, I'invention conceme le transport de medicament au sein de la 
cage d'un potypeptide selon I'invention et du ciblage de cellules 

5 grace a la capacite de I'OBPII a se fixer a un recepteur specifique. 

II est egalement dans I'etendue de I'invention de developper 
des prot6ines de fusion ou des protcines chimeriques comportant la 
cage correspondant aux lipocalines selon rinvention associfees a 
une proteine permettant un adressage cellulaire specifique 

10 generalement different de celui naturel des OBPII. La presente 
invention a done pour objet un poljrpeptide caracterise en ce que 
ledit polypeptide est exprime sous la forme d'une proteine de fusion 
avec une proteine permettant un adressage cellulaire specifique. 
Parmi les protSines permettant un adressage cellulaire specifique, il 

15 convient de citer les interleukines, les cytokines, les lymphokines, 
les chcmokines, les facteurs de croissance, les hormones, les 
anticorps mono- ou polyclonal. Les interleukines, cytokines et 
lymphokines sont choisies dans un groupe compose de preference 
des interleukines 11-1 a 11-20, des interferons a-IFN, p-IFN et y-IFN. 

20 Les facteurs de croissance sont de preference les facteurs 
stimulateurs des colonies (colony stimulating factors) G-CSF, GM- 
CSF, M-CSF et I'erythropoldtine. Les hormones sont choisies de 
preference panni les hormones steroidiennes. 

Selon un autre mode de realisation, le polypeptide selon 

25 I'invention en tant qu 'agent de ciblage de compose pharmaceutique 
est associe a une molecule permettant un adressage cellulaire 
specifique. Parmi, les molecules permettant un adressage cellulaire 
specifique, il convient de citer le groupe des steroides, des 
interleukines, des cytokines, des lymphokines, des interferons, des 
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facteurs de croissance, des hormones, des anticorps. De preference, 
la molecule est un steroide. L'association entrc Ic polypeptide selon 
I'invention et ladite molecule est realisee soit par une Uaison non 
covalente en utilisant par exemple le systeme avidine-biotine ou 
soit par une liaison covalente en utilisant par exemple des agents 
chimiques pontants. 

Parmi les composes pharmaceutiques que peut transporter et 
cibler le polypeptide selon I'invention, il convient de citer les 
medicaments et notamment les agents anticancereux. Les agents 
anti-canccreux sont selectionnes parmi le groupe des agents 
antiprolif6ratifs, antineoplastiques ou cytotoxiques et sont utilises 
pour arreter le developpement des cancers et pour induire une 
regression et/ou une elimination de la masse tumorale. Ces agents 
anticancereux sont de preference des radioisotopes, et de maniere 
15 encore preferee des radioisotopes emetteurs de rayons gamma tels 
que riodei3», mtrium«>, IW^, le Palladiumioo, le Cuivre^^, le 
Bismuth2i7 et rAntimoine^n. Les radioisotopes emetteurs de rayons 
beta et alpha peuvent egalement etre utilises pour la therapie. Les 
agents anticancereux non isotopiques lies au polypeptide selon 
I'invention sont multiples et varies; on peut citer: (i) les 
antimetabolites teUes les agents anti-folate, le methotrexate, (ii) les 
analogues des purines et des pyrimidines (mercaptopurine, 
fluorouracile, 5-azacytidine), (iii) les antibiotiques, (iv) les lectines 
(ricine, abrine) et (iv) les toxines bacteriennes (toxine diphtcrique) ; 
25 les toxines sont choisies de preference parmi I'exotoxine A de 
Pseudomonas, la toxine diphterique, la toxine cholerique, la toxine 
antiirox de Bacillus, la toxine Pertussis, la toxine Shiga de Shigella, 
la toxine apparentee a la toxine Shiga, les toxines d'Bscherichia coU, 
la colicine A, la d-endotoxine, l-hemagglutinine d'Haemoptvlus A. 
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LWntion conceme egalement une composition 
phamiaceutique comprenant un compose pharmaceutique Ue au 
moins a un polypeptide selon I'invention et un vehicule 
pharmaceutiquement acceptable. II est dgalement dans I'etendue de 
rinvention d'augmenter la capacite de fixation par mutagenese de 
cette meme proteine. L'invention conceme une composition 
phamiaceutique telle que defmie precedemment pour le traitement 
du cancer, et notamment le cancer de la prostate, le cancer du sein, 
le cancer de mtems, le cancer de I'ovaire, le cancer du foie et le 
carcinome des cellules epitheliales pulmonaires. Etant donnd que 
I'OBP denommee hOBPIlb, I'apolipoproteine D, la RBP et I'a-l-acide 
glycoproteine sont exprimees dans la prostate, la composition 
pharmaceutique selon l'invention est destinee au traitement du 
cancer de la prostate. De meme, etant donne qu»il a cte demontre 
que I'ARNm des prot6ines ApoD, RBP et LCNl est produit dans la 
glande mammaire en plus de la production de hOBPllb deja decrit 
dans la demande WO 99 07740, la composition pharmaceutique 
selon l'invention est destinee au traitement du cancer du sein. 

L'invention porte aussi sur un polypeptide selon invention 
en tant que transporteur de compose pharmaceutique. Par 
transporteur, on entend designer des polypeptides selon l'invention 
capable de vehiculer dans I'onganisme un compose pharmaceutique 
sans que ledit compose ne soit Ubere a un endroit privUegie dans 
I'oi^ganisme. Un tel polypeptide constitue un moyen de delivrance 
25 dudit compose pharmaceutique dans I'organisme. 

La presente invention conceme egalement une composition 
pharmaceutique selon l'invention caracterise en ce que ledit 
polypeptide constitue une forme retard de delivrance dudit compose 
pharmaceutique dans Torganisme. 
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En effet le compose pharmaceutique d'interet lie au 
polypeptide OBPII selon Tinvention diffuse progressivement dans 
Torganisme a mesure que ledit polypeptide transporteur est 
catabolise dans Torganisme. L'utilisation des techniques de TADN 

5 recombinant permet a ITiomme de Tart de modifier la duree de 
demi-vie du polypeptide OBPII dans Torganisme en introduisant des 
modifications dans ledit polypeptide. Ainsi, il peut etre interessant 
de developper un polypeptide homologue selon Tinvention pour 
lequel les sites de coupures proteasiques ont ete mutes afin 

10 d'augmenter la demi-vie dudit polypeptide dans Torganisme, II peut 
etre egalement interessant de developper un polypeptide 
multimerique, exprime par exemple sous la forme d*une proteine de 
fusion, afin d'eviter une « fuite glomerulaire » (clearance renale) et 
ainsi d'augmenter la demi-vie dudit polypeptide dans Torganisme. 

15 Selon un autre aspect, Tinvention conceme un compose 

caracterise en ce qu'il est choisi parmi un anticorps, un 
polypeptide, un ligand, un polynucleotide, un oligonucleotide ou un 
vecteur selon Tinvention a titre de medicament et notamment en 
tant que principes actifs de medicament ; ces composes seront 

20 preferentiellement sous forme soluble, associes a un vehicule 
pharmaceutiquement acceptable. Par vehicule 

pharmaceutiquement acceptable, on entend designer tout type de 
vehicule employe habituellement dans la preparation de 
compositions injectables, c'est-a-dire un diluant, un agent de 

25 suspension tel une solution saline isotonique ou tamponnee. De 
preference, ces composes seront administres par voie systemique, 
en particulier par voie intraveineuse, par voie intramusculaire, 
intradermique ou par voie orale. Leurs modes d'administration, 
posologies et formes galeniques optimaux peuvent etre determines 
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selon les criteres generalement pris en compte dans I'etablissement 
d'un traitement adapte a un patient comme par exemple I'age ou le 
poids corporel du patient, la gravite de son etat general, la tolerance 
au traitement et les effets secondaires constates, etc. 
5 L'invention conceme egalement une composition 

pharmaceutique comprenant un vecteur d'expression selon 
l'invention et un vehicule pharmaceutiquement acceptable. 

II est egalement possible d'utiliser la propriete d'expression 
dans des sites particuliers de ces proteines afin d'assurer une 
10 imagerie et/ou un diagnostic de certains types de cancer. 

Enfin, compte tenu de la forte expression des polypeptides 
selon l'invention dans le placenta (cf. figure 10), la presente 
invention presente differentes applications therapeutiques 
destinees a traiter des pathologies de la gestation chez la femme. 
15 Ainsi, un des objets de la presente invention est d'utiliser le 

polypeptide selon l'invention pour la preparation d'un medicament 
destine au transport de composes a travers la barriere placentaire. 
Ces composes sont de preference des molecules lipophiles. Le 
polypeptide selon l'invention pent etre utilise pour realiser le 
20 transport de composes de la mere gestante vers le foetus ; les 
composes pouvant etre choisis parmi les molecules d'interet 
therapeutique, de preference lipophiles, les acides gras essentiels, 
les hormones, les vitamines, et de maniere plus generale, les petites 
molecules lipophiles. 
25 En effet, il a etc demontre que les cellules des villosites 

placentaires s6cretent massivement des polypeptides selon 
l'invention, notamment des OBPII. Ces polypeptides se repandent 
ensuite dans le sang foetal et vers la circulation sanguine generale 
du foetus. 
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Egalement, le polypeptide selon rinvention peut etre utilise 
pour realiser le transport de compose du foetus vers le mere 
gestante. En effet, le foetus secrete au niveau des villosites des 
structures nasales des polypeptides selon rinvention qui participent 
5 aux echanges de molecules entre le foetus et la mere au niveau de 
la membrane amniotique. C'est done egalement un objet de la 
presente invention de fournir au foetus des polypeptides selon 
rinvention pour permettre le transport de composes presents dans 
le foetus, par exemple des xenobiotiques, vers le placenta et/ou vers 
10 la membrane amniotique, pour permettre la detoxification du 
foetus. 

Selon un autre aspect de rinvention, le polypeptide selon 
rinvention peut etre utilise comme marqueur de grossesse. En effet, 
le polj^peptide selon rinvention est present dans differents liquides 

15 biologiques de la mere tels rurine, le sang ; la mesure de sa 
concentration et/ou de sa presence constitue un indicateur de 
grossesse. A ce titre, ce marqueur pourra etre utilise, avec, ou a la 
place du, ou en complement du marqueur de grossesse que 
constitue la choriogonadotrophine humaine hCG ; le polypeptide 

20 selon rinvention et la hCG sont en effet des molecules qui sont 
secretees par les cellules placentaires trophoblastiques. 

Enfin, selon un autre aspect de rinvention, le polypeptide 
peut etre utilise comme marqueur de pathologies foeto-placentaires. 
II peut constituer un marqueur de la rupture de la membrane de la 

25 poche des eaux. 

D'autres caracteristiques et avantages de rinvention 
apparaissent dans la suite de la description avec les exemples et les 
figures dont les legendes sont representees ci-apres. 
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FIGURE 1 : Organisation genomique du locus LCNl/hOBPII 

La ligne du haut represente la region du chromosome 9q34. 
La double fleche indique Tintervalle entre la localisation des 
5 marqueurs polymorphes D9S1811 et D9S67 ; la position relative 
des marqueurs D9S67 et D9S1826 est incertaine. 

Le niveau du milieu indique Torganisation partielle des 
cosmides a3 loci differents : LCNlc, LCNlb-hOBPub, LCNl-hOBPna. 
Les cosmides (approximativement 40 kb) sont representes par des 

10 lignes horizontales avec leur nom et les bras des vecteurs T3 ou T7 
notes au-dessous de la ligne. Les fleches representent les differents 
genes ou pseudogenes avec leur orientation respective. Dans les 
cosmides, les lignes en pointilles verticales representent les sites 
EcoRI- Le sjonbole 0 indique une orientation incertaine du locus. 

15 Le niveau inferieur montre les structures intron/exon des 

genes LCN 1 et hOPBII : les boites noires representent les exons ; les 
fleches representent le site d'initiation de la transcription ; oil a ol5 
representent les sondes d'oligonucleotides utilisees pour cribler les 
cosmides ; Alu represente la presence de sequences repetees. 

20 

FIGURE 2 : Analyse **Dot Plot" de : 

(A) sequence locus LCNl-hOBPIIa (AC000396+ACXXXXX) 
centre locus LCNlb-hOBPIIb (AC002098) ; 

(B) sequence locus LCNl-hOBPIIa (AC000396+ACXXXXX) 

25 contre 

sequence locus LCNlc ; 

(C) sequence locus LCNlb-hOPBIIb (AC002O98) contre 
sequence locus LCNlc (AC002106). 
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Des sequences genomiques ont ete filtrees pour les 
sequences rcpetitives a Taide de « Repeatmasker » (REF), puis 
comparees et « dotplotted » avec le logiciel gcg en utilisant une taille 
de fenetre de 25, et un critere de 20 avec une homologie de 80%. 

FIGURE 3 : Sequence nucleotidique de genes hOBPII. 

Les lignes superieures representent la sequence hOBPIIa et 
les lignes inferieures la sequence hOBPIIb pour laquelle seuls les 
nucleotides differents sont representes ; un tiret indique I'absence 
de sequences correspondantes. Les capitales ombrees sont les 
sequences exoniques et les lettres minuscules les sequences 
introniques. Les tailles indiquees sur la gauche sont indiquees en 
pb. La boite TATA est en caracteres gras et le signal de 
polyadenylation est soulign6. Les boites indiquent les sites 
accepteurs d'epissage pour les exons 5, 5b, 5c. 

FIGURE 4 : Representation schematique des deux genes hOBPII 
et de leuT ARNm correspondants. 

20 Les lignes horizontales representent I'organisation 

exon/intron avec des tailles indiquees en pb. Les boites ombrees 
numerotees de 1 a 7 sont les sequences exoniques codantes des 
principaux transcrits ; les lettres b et c font reference a des exons 
sumumeraires. Les differents transcrits sont representes a I'aide de 

25 boites assemblies : les premieres, hOBPIIaa et hOBPIIba 
correspondent aux transcrits principaux, les autres correspondent 
aux formes issues d'un epissage altematif. i indique un decalage 
du cadre de lecture resultant de I'insertion ou de la deletion d'un 
exon et * represente un codon stop. La lettre « a » represente une 
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helice a et « b » des feuilles p predis par le logiciel DSC. Les lettres 
en italique sont des predictions obtenues avec le logiciel "Predator". 

FIGURE 5 : Alignement des sequences des protSines issues des 
5 deux genes hOPBIIa et hOBPIIb humains (hOBPHaa = 
OBP2aaHOMS, hOBPIIba = OPB2baHOMSA, hOBPIIbp = 
OPB2bbHOMSA, hOBPIIay = OBP2agHOMSA, hOBPIIap = 
OBP2abHOMSA), des Upocalines des larmes humaines 
(LCNl_HOMSA), d*OBPII de rat (OBP2_RATNO|, de 
10 lactoglobuline bovine BLG (LACB.BOSTA), de MUP de souris 
(MUP6_MUSMU), de RBP humaine (RBP.HOMSA), d'OBP bovine 
(OBP_BOSTA), de MUP de rat (MUP.RATNO), d*OBP porcine 
(OPB_SUSSC). 

Les residus dans les boltes gris fonce sont identiques et 
15 ceux dans les boites gris claires sont similaires. Les elements de 
structure secondaire predits avec le programme DSC sont soulignes 
et les residus d'amino-acides sont en italiques. Les feuillets p et les 
helices a sont numerotees pour hOPBIIa et b. Le site de clivage 
prevu du peptide signal est indique par une fleche (AAAiLS) en 
20 position 15. Des sequences non alignees de formes tres divergentes 
de genes episses, hOPBaS (OPB2adHOMSA) et hOBPby 
(OBP2bgHOMSA) ont ete ajoutees au bas de I'alignement apres 
I'analyse. 

25 FIGURE 6 : Analyse RT-PCR 

(A) Detection des produits RT-PCR LCNl, LCNlb, LCNlc 
avec leurs sondes specifiques, et (B) Detection des produits RT-PCR 
hOBPIIa et hOBPlIb avec leurs sondes specifiques. (C) ARN G3PDH 
controle. Les tallies sont indiquees en pb. 
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FIGURE 7 : Localisation tissulaire des ARNm hOBP 

Des sections du meat moyen (A,B)> des comets (C,D), de la 
prostate (E,F), des canaux deferents (G,H), des glandes mammaires 
(I, J) ont ete hybridees a des ribosondes de hOBP marquees a la 

5 digoxigenine-ll-UTP. L'hybridation avec une ribosonde hOBP sens 
n'a pas revele de signal (B,D,F,H, J). Un signal d'hybridation 
specifique est obtenu avec une ribosonde antisens (A,C,E,G, 1). Les 
fleches indiquent des structures differentes : AC : cellules 
acineuses, EC : cellules epitheliales, GC : cellules glandulaires, SD : 

10 canal secretoire et L : lumen (X200), 

FIGURE 8 ; Arbre de distance phylogenetique des lipocalines 
des vertebres. 

Les abreviations usuelles des lipocalines ont ete employees. 
15 Apres le symbole "J' sbnt indiquees les trois premieres lettres du 
' genre suivies des deux premieres lettres de Tespece. 

FIGURE 9 : Schema de revolution de la sous-famille de gene 
LCNl-OBPII au cours de revolution. 

20 Les boites indiquent les exons disposes sur une ligne 

representant TADN genomique. Les « // » entre les lignes indiquent 
que les loci ne sont pas consecutifs, sans qu'il soit possible de 
determiner Tordre. La large croix sous le symbole « ? » illustre un 
evenement de duplication partielle ou de complete duplication avec 

25 une deletion genomique ulterieure pour le locus LCNlc (choix 
indique par le symbole « * »]. La croix plus petite indique 
Telimination du septieme exon qui semble etre specifique de 
ITiomme a cause des nombreuses sequences repetees Alu 
presentent dans cette region genomique et parce que le rat a deux 
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genes VEGP. Le symbole « ** » marque Tetape de recrutement 
d'exons basee sur les donnees presentes et celles de la litterature ; 
cette etape a pu apparaitre a n'importe qu'elle moment apres les 
duplications des loci et a pu etre sequentielle, 

5 

FIGURE lO : Analyse par RT-PCR dans la sphere orale et la 
sphere genitale de Pexpression des autres lipocalines humaines 
connues. 

Definition de nouvelles fonctions OBP et VEGP pour les 
10 proteines RBP (retinol-binding-protein) et ApoD (apoliporoteine D), 

FIGURB 11 : Btude de Fanticorps polyclonal dirige contre les 
proteines hOBPII. 

La proteine de fusion est deposee dans les puits 1 et 3. Un 
15 echantillon de mucus nasal humain est depose dans les puits 2 et 
4. Les proteines contenues dans les puits 1 et 2 ont ete revelees par 
coloration au bleu de Coomassie. L'anticorps hybride sur la 
membrane obtenue par Western-blotting revele specifiquement la 
proteine GST-hOBPIIb entre 30 et 42 kDa (puit 3) et les hOBPIIa et 
20 hOBPIIb (puit 4) de 18 kDa dans le mucus nasal humain. 

FIGURB 12 : Immunohistochimie sur les tissus de Tappareil 
olfactif« 

Une forte immunoreactivite est reperable sur la coupe de 
25 septum (coloration verte, A) sur les deux coupes de comet (C et D) 
et sur la coupe de meat moyen (F). Les temoins negatifs realises 
pour le septum (B) et pour le cornet (E) et pour le meat moyen (G) 
ne montrent au/^ ane reactivite. Les noyaux des cellules sont reperes 
par une coloration au DAPI (coloration bleue). Les grossissements 
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Utilises sont de X 100 pour les coupes A, B, C, E et G et de X 200 
pour les coupes D et F. 

FIGURE 13 : immunohistochimie sur tissus de la sph^e orale 

5 Ces deux tissus, glandes lacrymales (A, B) et glandes de Von 

Ebner (E, F) montrent une forte immunoreactivite en comparaison 
des resultats obtenus grace au serum pre-immun (C pour les 
glandes lacrymales et D pour les glandes de Von Ebner). 
Grossissement X200. 

iO 

FIGURE 14 : Immunohistochimie sur les ^ndes mammalres et 
poumon 

Une forte immunoreactivite est visible sur les coupes de 
glandes mammaires (A et B) compare au temoin negatif ( C ) reaUse 
15 grace au serum-pre immun. Une forte immunoreactivite est 
egalement observee sur les coupes de poumon (E et F) comparee 
toujours au temoin negatif (D). chaque observation est faite a un 
grossissement X 100 pour A et C et a un grossissement X 200 pour 
B, D, E et F. 

20 

Figure 15 : Mise en evidence des proteines hOBPII dans 
differentes structures nasales : Comet (A : 20Qx, B : 40Qjc), 
Septum (C : 300x, D 6O0x), Meat moyen (E : 400x, F : 60Qx) : 

Detection des proteines hOBPII avec un s6rum polyclonal de lapin 
25 revele par une activite peroxidasique detecte par DAB. AC : cellule 
acineuse secretrice, P : precipite de DAB (detection hOBPII) 
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Figure 16: Mise en evidence de la proteine LCNl dans 
difr.§rentes structures nasales : Comet (A : 20Qx, B : SOOx), 
Septum (C : lOOx, D 50Qx), Meat moyen (E : 20Qx, P : 60Qx) : 

Detection de la proteine LCNl avec un serum polyclonal de lapin 
revele par une activite peroxidasique detecte par DAB. AC : cellules 
acineuse secretrice. P : precipite de DAB (detection LCNl) 

Figure 17: Mise en evidence de la proteine ApoD dans 
differentes structures nasales: Comet (A: SOOx, B: 700x), 
Septum (C : 30Qx), Meat moyen (D : 400x) : 

Detection de la proteine ApoD avec un anticorps monoclonal de 
souris revele par une activite peroxidasique detecte par DAB. AC : 
ceUule acineuse secretrice, P : precipite de DAB (detection ApoD) 

Figure 18: Mise en evidence de la proteine hOBPII dans 
differentes structures de la sphere orale : Glande Lacrymale (A : 
200x, B : 600x), Glandes de Von Ebner (C : lOOx, D : 400), 
Poumon (E : 200x, SOOx) : 

Detection de la proteine hOBPII avec un serum polyclonal de lapin 
revele par une activite peroxidasique detecte par DAB. AC : ceUule 
acineuse secretrice, P : precipite de DAB (detection hOBPII) 

Figure 19: Mise en evidence des proteines hOBPII dans 
differentes stractures placentaires : viUosites choriales (A: 
300x, B : SOOx), Membrane Amniotique (C : SOOx), Cordon (D : 
600x) : 

Detection des proteines hOBPII avec un serum polyclonal de lapin 
revele par une activite peroxidasique detecte par DAB. L : lacune 
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(contient sang matemel), C : capillaire foetal, Am : membrane 
amniotique, E : cellules epitheliales derivees de Tectoblaste extra- 
embiyonnaire, MB : membrane basale, M : couche 
mesenchymateuse, P : precipite de DAB (detection hOBPII) 

Figure 20 : Mise en evidence de la proteine LCNl dans 
differentes structures placentaires : villosites choriales (A : 
200x9 B : 800x), Membrane Amniotique (C : 600x), Cordon (D : 
SOOx) : 

Detection de la proteine LCNl avec un serum polyclonal de lapin 
revele par une activite peroxidasique detecte par DAB. L : lacune 
(contient sang matemel), C : capillaire foetal, Am : membrane 
amniotique, E : cellules epitheliales derivees de Tectoblaste extra- 
embiyonnaire, MB : membrane basale, M : couche 
mesenchymateuse, P : precipite de DAB (detection LCNl) 

Figure 21 : Mise en evidence de la proteine ApoD dans 
differentes structures placentaires : villosites choriales (A : 
lOOXy B : 50Qx), Membrane Amniotique (C : 40Qx), Cordon (D : 
20 400x) : 

Detection de la proteine ApoD avec un anticorps monoclonal de 
souris revele par une activite peroxidasique detecte par DAB, L : 
lacune (contient sang matemel), C : capillaire foetal. Am : 
membrane amniotique, E : cellules epitheliales derivees de 
25 Tectoblaste extra-embryonnaire, MB : membrane basale, M : couche 
mesenchymateuse, P : precipite de DAB (detection ApoD) 
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EXEMPLES 

EXEMPLB 1 : MATERZELS ET MBTHODES 

5 I.A. Banqne de cosmides du chromosome 9 hnmain 

Une copie de la banque de cosmides specifiques du 
chromosome 9 humain LL09NC01P construite par le Dr. J. 
AUmeman (Biochemical Sciences Division, Lawrence Livermore 
National Laboratory, Livermore, CA USA) sous I'egide du National 
10 Gene Library Project supporte financierement par le departement 
americain de ^neiigie a etc utilisee. Le criblage de la banque et 
I'analyse des clones ont ete realises tel que decrit precedemment 
(Lacazette et al., 1997). 

15 l.B. Clonage et analyse de sequence 

Une banque Lambda gtll d'ADNc de testicules humains 
(Clontech) (10^ p.f.u.) a ete amplifiee par 30 cycle.s de 
polymerisation en chaine (PGR) (94°C 45 sec, 54 °C 45 sec, 72°C 
Imin 30 sec) avec I'amorce oliEST58 CCTGCAGGTACATGAGCTTCC 

20 et des amplimeres 5' ou 3' de criblage d'inserts situes sur les bras 
du vecteurs Lambda gtll. Une PGR nich6e a ensuite ete realisee 
avec OUEST26 CGCTGTATTTGCCAGGCTCC et des oligonucleotides 
specifiques du bras du vecteur. Les produits PGR ont ete sous- 
clones dans le vecteur pGEM-T(r), ce qui a permis d'obtenir 

25 I'extremite 5' des ADNc du gene hOBPII. 

Les sequences obtenues en utilisant I'oligonucleotide 
standard pGEM-T (r) et en utilisant un mixe reactionnel pret a 
I'emploi de sequengage a base de colorant terminateur (Applied 
Biosystems) ont ete separees par electrophorese en utilisant un 
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sequengeur automatique ABI PRISM 377 (Perkin Elmer) puis ont 
etc analysees avec le logiciel Sequence Navigator 1.0.1. (Perkin 
Elmer). Des clones d'ADNc pleine longueur de hOBPIIa (hOBPIIa a, 
hOBPIIa p, hOBPIIa 8, hOBPIIa y) et hOBPIIb (hOBPIIb a, hOBPIIb 
5 p, hOBPIIb y) ont ete obtenus a partir de la RT-PCR par purification 
des bandes d'interet selon les instructions du fabricant (gel 
extraction kit de Qiagen) ou en sous-clonant dans un vecteur 
pGEM-T(r) les produits de la PGR nichee pour les formes 
alternatives faiblement exprimees. 

10 

IC. Analyse par RT-PCR 

Des 6chantillons de tissus ont ete collectes chez des 
individus caucasiens ages de 45 a 55 ans en accord avec la 
reglementation frangaise en vigueur. L'ARN total est extrait selon 

15 une methode en une seule etape utiUsant le reactif ARN NOW® 
selon les instructions du fabricant (Biogentex). 5 ^g d'ARN total ont 
ete retro-transcrits dans un volume final de 20 ii\ en utilisant 0,5 
ug d'oligonucleotide 
GACTCGAGTCGACATCGATTTTTTTTTTTTTTTTT avec le systeme de 

20 preampUfication Superscript® (Gibco BRL). Trois jil de ces reactions 
sont ensuite utilises pour les PGR suivantes. L'expression des 
ARNm specifiques a ete determinee par PGR en utilisant : les 
amorces TL : CCTCTCGCAGCCCCAGCAAG et AP 
GACTCGAGTCGACATCG pour les genes de type LCNl (LCNl, 

25 LCNlb, LCNlc) et pour les genes de type hOBPII, les amorces DE : 
CGCCCAGTGACCTGCCGAGGTC, et FI : 

CTTTATTTGGAGTCAGGTGGGTG. Comme controle de qualite des 
ARN, les amorces G3PDH1 : CTCTGGGCCCTCTGCTGATG et 
G3PDH2 : CGTGGTTCACCACCTTGTTG du gene G3PDH ont ete 
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utilisees ; le gene G3PDH est considerd comme etant 
constitutivement exprime dans tous les types cellulaires. 32 cycles 
de PGR (94° C 45 sec, 54° C 45 sec, 72° C 2 min. 30 sec) ont cte 
realises et les produits d'amplification ont ete separes sur gel 
5 d'agarose a 1%. L'ADN est transferee sur une membrane Hybond 
N+®. 

Pour la detection de I'expression des differents genes, 
plusieurs oligonucleotides specifiques des genes respectifs ont ete 
synthetises : 
10 -olLCNl: GACTCAGACTCCGGAGATGA, 

- olLCNlb : AACTCAGACACCAGAGATGA, 

- olLCNlc : GACTCAGATCCCGGAGATGA, 

- ol5 : CCAGGAGGGACCACTACA specifique du gene hOBPIIb," 

- ol4 : CCGGGACGGACGACTACG specifique du gene hOBPIIa, 
15 - G3PDH3 : CTCATGACCACAGTCCATGC, 

Les oligonucleotides sont marques au y^^p.^^jp utilisant 
de la T4 kinase (Applied Biosystem) ; les hybridations des 
oligonucleotides marques sont realisees a 42° C. Le lavage final est 
realise dans une solution de 0,1 X SSC, 0,1% SDS a 48° C pendant 
20 20 min. La specificite des reactions d'hybridation des 
oligonucleotides est controlee en utilisant des echantillons d'ADN 
cosmidique digere (p233G2 pour LCNl et hOBPIIa, P19E7 pour 
LCNlb et hOBPIlb, P181A9 pour LCNlc) et charges sur le gel avec 
des produits de RT-PCR. 

25 

l.D. Genotvpage et analyse de liaison 

Le genotypage est realise par des reactions PGR en utilisant 
100 ng d'ADN genomique provenant de 8 fiamilles de reference du 
CEPH et utilisant les oligonucleotides oli9 
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TGTTCGGGAACGCAGCTT ct olilObis 

TGCCGCTGTCCCCACGTCGG. Les parametres du thermocycleur 
consistent en un cycle initial a 94" C pendant 10 min suivi par 30 
cycles a 94" C pendant 30 s, 55" C pendant 30 s et 70° C pendant 
45 s puis en une etape d'^longation finale de 10 min a 70° C. Les 
produits PGR sont ensuite analyses sur un gel d'agarose a 3%. Les 
informations concernant les marqueurs du chromosome 9 peuvent 
etre obtenues a I'adresse Internet suivante (hTTP://galton.ucl.ac.uk) ; 
les analyses ont ete realisees en utUisant les outils d'etudes de 
liaison prealablement decrites dans Lacazette et al. (1997). Les 
haplotypes sont reconstruits manuellement selon les evenements 
de recombinaison prealablement decrits dans la famille 1362 
(Attwood etcd., 1994). 



I.E. Predictions de stmctures secondaires 

Un alignement multiple des proteines Upocalines pour 
lesquelles les structures cristallographiques ont deja ete decrites 
(Monaco et al, 1992 ; Spinelli et al., 1998) avec les proteines 
hOBPIIa et hOBPIIb a ete obtenu en utilisant le logiciel Clustalx 
(ftp.infobiogen.fr). Les structures secondaires putatives ont ete 
determinees avec le programme DSC (Discrimination of protein 
Secondary structure Class) developpe par R.D. King et M.J.E. 
Sternberg (http:/^ioweb.pasteu^.fr/seqanal/interfaces/dsc-simple.html) . Les 
structures secondaires des proteines correspondantes aux formes 
25 alternativement epissees sont supposees identiques aux formes 
traditionnelles avant le decalage du cadre de lecture; apres ce 
decalage la prediction de structure est effectuee avec une seule 
sequence et est reaUsee en utilisant le logiciel Predator 
(http://pbil .ibcp.fr/cgi-bin) , 
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L'analvs e phvlog^netigne 

Les proteines lipocalines dont les sequences sont connues 
dans leur totaUte ont ete alignees trois fois consecutivement en 
utilisant le logiciel ClustaJx (ftp://ftp.inforbiogen.fr). Des distances dans 
I'arbre phylogenetique ont ete calculees avec Clustalx et dessinees 
avec Njplot. 



10 



15 



20 



25 



1«G. Hybridation in situ 

Des coupes seriees realisees au ciyostat (8 Mm d'epaisseur) 
sont collectees sur des lames SuperFrost® Plus (Menzel Glazer) et 
stockees a - 80» C. Des sondes ARN antisens et sens sont obtenues 
selon les techniques standard en utilisant la T7 ou la SP6 
polymerase a partir d'une matrice obtenue par digestion avec des 
enzymes de restriction Ncol ou PstI du clone cDNA de phOBPIIaP2 
et en utilisant du DIG-l l-UTP (Boehringer Mannheim) (la longueur 
de la sonde est approximativement de 150 nucleotides). Les 
matrices digerees par PstI et transcrites par TARN polymerase de T7 
correspondent a la sonde antisens et les matrices digerees par Ncol 
transcrites par TARN polymerase SP6 correspondent 4 la sonde 
sens. Des sections de tissus sont fixees dans du paraformaldehyde 
4% pendant 15 min puis rincees pendant 5 min daas du PBS 2X 
Apres acetylation (2 x 5 min dans un tampon de triethanolamine 
(TEA) pH 8. contenant 0,25% v/v d'anhydride acetique), les sections 
tissulaires sont prehybridees a 60» C pendant 15 min dans de la 
formamide 50o/o/lX SSC. Les sondes marquees sont appliquees sur 
chacune des sections dans 50 pi de tampon d'hybridation (50% 
formamide. IX Denhardfs, 500 ^g/ml total d'ARNt, 10% de 
Dextran sulfate, 10 mM de dithiotreitol). Les sections sont 
recouvertes puis incubees dans des chambres humides a 50° C 
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pendant la nuit. Apres hybridation, les lames sont immergees a 55" 
C dans un tampon de lavage (50% formamide, IX SSC) pendant 2 
heures. Chaque lame est ensuitc rincde 2 fois 5 min dans du 2X 
SSC a temperature ambiante, puis traitee pendant 30 min avec 10 

5 mg/ml de RNase a 37° C, et enfin immergee 2 heures a 55" C dans 
une solution de lavage (50% formamide. 2X SSC). Les lames sont 
ensuite placees pendant 15 min a 55° C dans du 0,1 X SSC. La 
detection immunologique est realisee en utilisant un anticorps anti- 
DIG conjugue a la phosphatase alkaline (fragments Fab) selon le 

10 protocole de Boehringer Mannheim. Les sections sont examinees a 
des grossissements differents utilisant un microscope Axiophot 
(Zeiss). 

l.H. Obtention d*mi anticorps po lyclonal diriye contre 

15 les proteines hOBPn 

Deux cent cinquante nl de proteines de fusion ont etc 
foumis a la societe Agro-Bio pour la production d'anticorps. Des 
lapins (New Zealand White SPF) sont injectes aux jours 0, 14, 28 et 
42. Les serums sont preleves aux jours 0, 35, 49 et 63. Afm de 

20 tester I'anticorps, la proteine de fusion est deposee dans les pistes 1 
et 3 (Figure 11), alors que du mucus nasal humain est depose dans 
les pistes 2 et 4. Les pistes 1 et 2 ainsi que la piste correspondant a 
I'echelle de poids mol6culaire, correspondent a une revelation par le 
bleu de Coomassie. Les pistes 3 et 4 correspondent a une detection 

25 des proteines reconnues par I'anticorps a I'aide de la technique de 
Western blot. Les pistes 1 et 3 montrent la presence d'une serie de 
proteines recombinantes tronquees entre 30 et 42 kDa issues d'une 
synthese peu efficace due a la presence de nombreux codons rares 
Chez la bacterie au sein de la sequence de hOBPIIb. Toutefois cette 
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production dc proteine recombinante fut suffisante pour produire 
un anticorps polyclonal de bonne qualite comme indique par la 
revelation dans la piste 4 correspondant au mucus nasal, d'une 
bande de 18 kDa specifique des proteines hOBPii. 

l.I. imniuno histocliimi«» 
l.I.l. Des coupes seriees de 8 urn de differents tissus sont fixees 
au para-formaldehyde (5min), et rincees trois fois au PBS xl (15 
min) puis incubees 30 min dans une solution 3% de BSA en PBSxl, 
avant d'etre incubees durant la nuit en presence de I'anticorps anti- 
proteine de fusion en solution PBSxl. Apres trois ringage en PBSxl 
(15 min), un anticorps anti-lgG de lapin couple au FITC (coloration 
verte en fluorescence) en solution de PBSxl est place 3 heures au 
contact des lames. Apres un ringage en PBSxl, une solution de 
DAPI (100 ng / Hi en PBSxl) est appliquee pendant 10 min (contre 
coloration des noyaux cellulaires en bleu). Apres trois ringages en 
PBSxl (15 min), les lames sont montees dans de I'eau glycerinee 
(50/50). L'analyse est realisee en presence de filtres DAPI et FITC a 
I'aide d'une camera CDD en utilisant un temps d'integration entre 4 
20 et 32 ms. 



15 



1.1.2. Les tissus sont congeles k -80^C en presence d'OCT. Des 
coupes seriees de 7micromdtres sont realisees k I'aide d'un 
microtome. Us tissus sont ensuite fixes a la Para-Formaldehyde 
25 4% en PBS. Les lames sont incubees pendant 10 min dans une 
solution de methanol en presence de 4,5% de H202 , puis rincees 
trois fois en PBS pendant 5 min Apres une incubation pendant 30 
min dans une solution de 3% d'albumine de serum de boeuf, le 
premier anticorps (dilue au 1/350) est incube une nuit a 
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temperature ambiante (Anticorps polyclonaux de lapin pour hOBPII 
et LCNl, et monoclonal de souris pour ApoD). Puis, apres trois 
ringages de 15 min en PBS, le deuxieme anticorps (dilue au 1/300) 
(anti-lapin pour hOBPII et LCNl, et anti-souris pour ApoD) est 

5 incube 3 h a temperature ambiante. Apres trois ringages en PBS 
pendant 15 min, una revelation a la p6roxidase par le DAB est 
realise pendant 2 a 10 min, a I'aide du kit « Vector Les lames sont 
ensuite rincees a I'eau, et centre colorees a ITiematoxyline de Mayer 
pendant 2 min. Apres deux ringages a I'eau, les lames sont 

10 deshydratees par bassinage successif dans des solutions d'ethanol 
70", 95°, 100°, 100°, et finalement deux bains de toluene. Les lames 
sont ensuite montees en baume du Canada, et observees a I'aide 
d'un microscope Zeiss. 



BXEMPLE 2 : IDENTIFICATION D UN GENE HOMOLOGUE A 
LCNl LOCALISE SUR LB CHROMOSOME 9 
HUMAIN 

^identification de I'ADN complementaire de LCNl codant 
20 pour la lipocaline des larmes humaines (Lassagne et Gachon, 1993) 
a prealablement ete rapportee, ainsi que la localisation du gene sur 
le chromosome 9q34 (Lassagne et cd, 1993 ; Lacazette et cd, 1997). 
Les deux gfines codant pour les proteines des glandes de von Ebner 
1 et 2 (Kock et cd, 1994) correspondent aux proteines homologues 
25 de LCNl chez le rat ; ceci pose la question de savoir s'il existe 
d'autres genes codant pour une proteine LCNl dans le genome 
humain. Les experiences d'hybridation in situ (Lassagne et cd, 1993) 
ainsi que les analyses avec des hybrides somatiques (Lassagne et 
cd, 1995) indiquent que, s'ils existent, ces genes humains 



wo 01/12806 



PCT/FROO/02319 



50 



10 



15 



20 



25 



additionnels doivent se trouver localises dans la region 
chromosomique 9q34. 

Une banque de cosmides specifiques du chromosome 9 
humain (LL09NP01) a ete criblee avec la sonde d'ADNc LCNl 
humaine ; 26 cosmides ont ete identifies ; ceux-ci ont ete digeres 
par EcoRI ou PvuII, puis hybrides successivement avec I'ADN de 
LCNl et differents oligonucleotides (figure 1). 

Us cosmides sont divises en 3 groupes. Le premier groupe 
(clones P32H3, P41B5, P63B6. P92H20. P109C6. P145H6 P195B4 
P233G2, P233P2, P265D4, et P276H8) correspond aux cosmides 
contenant une sequence du g^ne LCNl prealablement isole 
(numero d'accession : L14927) forme par 7 exons (Holzfeind et Redl, 
1994). Le second groupe (clone P19E4, P19E7, P42H9, P98H5 et 
P142H8) correspond a la sequence LCNlb homologue a LCNl (clone 
P19E4) (numero d'accession : Y 10826) depuis le promoteur 
jusqu'au 6^- exon puis qui diverge ensuite. Un troisieme groupe de 
cosmides (clone PllOCl. P174E4, P174E5. P181A9, P181B6 
P211A7. P238C6 et P291E1) contient une region LCNlc, etabli L 
partir du sequengage partiel du clone P181A9 (numero d'accession 
Y10827), qui est fortement homogue a LCNl seulement a partir du 
promoteur jusqu'a I'exon 2. Ainsi, LCNl est le seul gene qui 
possede le 7^e et dernier exon. De plus, les boites TATA sont 
degenerees dans les promoteurs des genes LCNlb et LCNlc. 



EXEMPLE3: IDENTIFICATION DE DUPLICATIONS 

GENOMIQUES CONTENANT LES GENES DE 
LIPOCALINES ET CARTOGRAPHIE DE LA 
REGION CHROMOSOMIQUE 9Q34 
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Au cours de la periode d'identification de la famille de. gene 
LCNl, un vaste projet de cartographic physique a conduit a 
I'identification de contigs de cosmides couvrant partiellement la 
region chromosomique 9q34 (Nahmias et al, 1994, Van 
5 Slegtenhorst et ah, 1995, Homigold et al, 1997) ; le sequengage des 
clones correspondants a ete realise par un groupe du Massachusset 
Institute of Technology (Boston, USA). 

Des analyses de comparaison de sequences dans les 
banques de donnees de LCNl, LCNlb et LCNlc ont revele des 
10 homologies fortes entre le gene LCNl prealablement decrit (numero 
d'accession L14927) et les trois sequences cosmides : P161A1 ayant 
le numero d'accession AC002098, P203H12 avec le numero 
d'accession AC000396 et P161G2 avec le numero d'accession 
AC002106. 

15 Une analyse tres fine notamment de la region 3' des genes 

LCNl a revele que la sequence LCNlc correspondait au clone ayant 
le numero d'accession AC002106, LCNlb au numero AC002098 et 
LCNl au numero AC000396 ; il existe cependant une insertion de 
60 palres de base a la position 12360 du clone ayant le numero 

20 d'accession AC000396 par rapport k celui ayant le numero L14927. 
Des analyses complementaires ont revele que ces sequences sont 
homologues sur une region beaucoup plus large que les genes 
LCNl. Comme illustre par les analyses en dot plot (figure 2), ces 
trois cosmides correspondent a des regions genomiques dupliquees 

25 ; les cosmides P161A1 (AC002098) et P203H12 (AC000396) sont 
homologues sur la totalite de leurs sequences ; le cosmide P161G2 
(AC002106) n'est homologue a la sequence uniquement pour des 
sequences situes en amont de I'intron 3 du gene LCNl. 



wo 01/12806 




PCT/FROO/02319 



Les positions relatives de ces regions dupliquees du 
chromosome 9 humain ont ete analysees. Les resultats ont ete 
compares avec la carte physique etablie dans le cadre du projet de 
cartographic physique par des analyses de restriction des cosmides 
5 (Homigold et cd, 1997) en utilisant la meme banque LLN09NC01P. 

Approximativement les memes cosmides ont ete trouves dans les 

deux recherches pour le locus LCNlc ; la comparaison de sequence 
. . du cosmide P181A9 revele que son extremite T3 contient le gene 
Surf 5 (figure 1). De plus, AC002106 est localise dans un contig de 

.10 sequence entre ABO et le locus Surfeit confirmant la localisation de 
LCNlc. P161A1 et P203H12 ont des localisations moins precises en 
utilisant les donnees de Homigold et de ses collaborateurs a cause 
de la limite de la strategic de cartographic de restriction pour les 
regions dupliquees. P203H12 (AC000396) semble correspondre au 

15 gene LCNl qui a ete prealablement localise pres du marqueur 
D9S1826 (Lacazette et al 1997) a Texception d'une insertion de 60 
paires de bases. 

Pour tester si P203H12 peut correspondre a une;4^™« region 
dupliquee, la region a ete testee par PGR sur jde TADN genomique 

20 de, 150 individus non apparentes qn utilisant des amorces 
specifiques pour AC000396 et L14927. Une beuide unique 
. correspondant a la longueur de la sequence AC000396 a ete 
detectee (donnee non montree) prouvant ainsi que P203H12 
contient le gene LCNl prealablement decrit. Le locus LCNlb n^a pas 

25 ete positionne precisement dans la region comme il est demontre 
par le fait que les extremites AC002095 ainsi que les extremites des 
cosmides contenant LCNlb ne detectent aucune sequence 
homologue dans les banques de donnees. 
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L'analyse des sequences a permis didentifier, un mini- 
satellite putatif a la position 3177-3724 du cosmide correspondant 
a AC002098 (Figure 1) ; un pblymorphisme rare a ainsi ete mis en 
evidence dans une population de 20 individus non apparentes (PIC 
5 = 0,05). Ce nouveau marqueur polymorphe n'est informatif que 
dans la seule famille 1362 sur les 8 families de reference du CEPH 
testees. 

Uanalyse de liaison a revele des lod-scores a deux points 
superieurs a 3 a teta = 0 pour les marqueurs D9S275 et D9S1818. 
10 La reconstruction de Thaplotype a confirme la localisation du gene 
LCNlb entre les marqueurs D9S1811 et D9S67 dans le 
chromosome 9q34 (Figure 1). 

15 BXEMPLE 4 : IDENTIFICATION DE DEUX NOUVEAUX GENES 

DE LIPOCALINE 

Les analyses de sequences ont revele des donnees nouvelles. 
La comparaison de AC002098 a la banque de donnees a 
revele des similarites entre cette sequence et les genes de 

20 lipocalines. En plus de la region 21000 a 27000 qui contient le gene 
LCNlb, la region autour de la position de 2150 contient des 
sequences presentant des similitudes avec les sequences codant 
pour les proteines de liaison aux odeurs de rat de type II, des 
lipocalines des larmes ainsi que pour TEST AA460385. 

25 Parallelement, la comparaison de la sequence AC000396 a 

la banque de donnees a revele en plus de la region 1 1 100 a 17100 
contenant le gene LCNl, des similitudes pour le meme groupe de 
sequences dans la region 36600 a 37800. 
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L'EST AA460385 exprimee dans les testicules humains 
correspond a 4 exons du nouveau gene de lipocaline present dans 
le clone P161A1 (AC002098). Un axon putatif de 50 paires de bases 
similaire a la sequence EST est egalement present a I'extremite du 
5 clone P203H12 (AC000396). 

Les inventeurs ont done conclu a I'existence d'un nouveau 
gene de lipocaline a une position distale de LCNlb. Les inventeurs 
ont emis Thypothese, que suite a une duplication genomique, un 
second gene orthologue au gene codant pour TEST est present dans 
10 la region 3' de LCN 1 . 

Le sequengage du cosmide P233G2 contenant cette region 
(Figure 1) avec des oligonucleotides definis a partir d'EST a en effet 
revele la presence d'un autre gene de lipocaline a un locus distant 
de 20 kb distal du gene de LCNl. Pour identifier les premiers exons 

15 des deux nouveaux genes, des PGR nichees sur des clones cDNA 
provenant d'une banque de testicules ont ete realisees entre les 
oligonucleotides localises dans la region 5' de TEST et les bras du 
vecteur. Les produits PGR sont clones et leur sequence a revele 
trois exons additionnels d'apres la sequence genomique (Figure 1). 

20 Une boite TATA est presente en amont du premier exon dans les 
deux cas (Figure 3). Les deux ARNm, hOBPIIa correspondant au 
gene localise en aval de LCNl et hOBPIIb localise en aval de LGNlb 
(Figures 3 et 4), sont identiques a 97,5% et 63 % a ceux 
correspondant au gene LGNl. Les organisations intron/exon de ces 

25 deux genes sont consistantes avec la famille des lipocalines. 

De plus, les sequences proteiques deduites (170 amino 
acides) confirment I'appartenance a la famille des Upocalines. Les 
deux proteines matures putatives hOBPIIa (MW = 17,8 kDa) et 
hOBPIIb (MW = 18,0 kDa) sont identiques a 89%. Ges deux 
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nouvelles proteines possedent un peptide signal putatif de 15 
amino acides (Figure 5), les residus conserves GXWY a la position 
27 a 30 et deux cysteines susceptibles d'etre impliquees dans un 
pont disulfure (position 74 a 166). 
5 Cependant, les comparaisons de sequences par paire avec 

les autres lipocalines indiquent une faible conservation des residus 
acides amines (15 a 25%) a I'exception de TL/VEG humain code par 
le gene LCNl (valeur moyenne 43 % sur 155 amonoacides) et 
rOBPII de rat (valeur moyenne 45,5 %). Par ailleurs, les points 

10 isoelectriques calcules de hOBPIIa et de hOBPIIb sont 
respectivement de 7,85 et de 8,72 alors que ceux des lipocalines 
sont acides (aux environs de 4,5) a I'exception de I'OBPII de rat (PI = 
9,01). La prediction des structures secondaires des proteines 
hOBPIIa et hOBPIIb avec le logiciel DSC en effectuant des 

15 alignements multiples avec les sequences de lipocalines de 
structures connues indique la presence de 8 brins de feuillets p 
antiparalleles pouvant permettre la formation d'un calice suivi par 
une helice a et un feuillet 3 final en accord avec les donnees 
connues des structures des lipocalines (Figure 5). 

20 

EXEMPLE 5 : ETUDE DE L'EXPRESSION DES GENES DE 
LIPOCALINES IDENTIFIES 

Pour preciser si LCNlb, LCNlc, hOBPIIa et hOBPIIb sont 
25 des genes exprimes, des analyses de RT-PCR ont ete realisees sur 
18 tissus humains differents connus pour produire des lipocalines 
(Figure 6). 

Deux couples d'amorces ont ete synthetises ; Tun reconnalt 
les ARNm de type LCNl et I'autre les ARNm de type hOBPlI. 
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Ltiybridation des oligonucleotides specifiques des genes sur des 
membranes sur lesquelles sont immobilises les produits de RT-PCR 
apres transfert par la technique de Southern, puis le sous-clonage 
des produits hybrides ont reveles que LCNlb et LCNlc ne sont 
5 exprimes dans aucun des produits testes, alors que les ARNm de 
LCNl sont detectes dans la glande lacrymale, les glandes 
sudoripares, les glandes de von Ebner, le septum nasal, 
I'epithelium du comet nasal , tout comme le placenta et les glandes 
mammaires (Figure 6A). Ces donnees et les informations de 
10 sequences qui indiquent que la boite TATA et le dernier exon ont 
tte perdus permettent d'affirmer que LCNlb et LCNlc sont des 
pseudogenes qui ne participent pas a la formation des proteines 
LCNl humaines. 

A I'inverse, les genes hOBPIIa et hOBPIIb sont exprimes, ce 
15 qui confirme leur detection precedente dans les banques d'ADNc. 
De maniere surprenante, bien que les deux proteines hOBPIIa et 
hOBPIIb soient tres similaires sur la totalite de leur sequence y 
compris dans la region promotrice de 1,5 kb, leur profil 
d'expression sont differents (Figure 6B). La proteine hOBPIIa est 
20 fortement exprimee dans le septum nasal, le meat moyen, le comet 
nasal, les testicules et le placenta et plus faiblement dans les 
glandes mammaires, les glandes lacrymales, les glandes 
sudoripares, les glandes de von Ebner et le poumon. A I'inverse, la 
proteine hOBPIIb est exprimee de maniere predominante dans la 
25 prostate, les testicules et les glandes mammaires et plus faiblement 
dans les glandes sous-maxillaires, le septum nasal et le meat 
moyen. 

De plus, les analyses de RT-PCR ont revele I'existence 
d*un epissage altematif du produit de transcription du gene 
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hOBPlIa et du gene hOBPIIb qui genere respectivement quatre et 
trois ARNm (Figures 3, 4, 5 et 6). 

La transcription du gene hOBPIIa genere au moins quatre 
ARNm qui cedent pour quatre proteines differentes; le premier 
ARNm code pour la proteine hOBPIIaa qui correspond a la proteine 
hOBPIIa decrite precedemment. Dans le gene hOBPIIa, trois sites 
accepteur d'epissage differents ont ete identifies pour I'exon 5 
(figure 3 et 4) formant ainsi deux autres variants d'epissage. Un 
premier variant d'epissage presente un site accepteur pour I'exon 5 
localise 49 pb avant le precedent (exon 5b) ; ceci genere un ARNm 
de 725 nucleotides qui code pour la proteine hOBPIIa3 de 146 
aminoacides. Cette proteine est identique jusqu'au 8^* feuillet p 
putatif puis difierente ensuite avec seulement 16 aminoacides 
additionnels. Un second variant d'epissage presente un site 
accepteur pour I'exon 5 localise 65 pb avant le precedent (exon 5c) ; 
ceci genere un ARNm de 741 nucleotides qui code pour une 
proteine hOBPIIay de 228 aminoacides. Cette proteine possede les 
huit premiers feuillets p putatifs identiques a ceux de hOBPIIaa 
puis est differente dans la region C-terminale (figure 5) 4 cause 
d'un decalage de cadre de lecture genere par cet 6v6nement 
d'epissage altematif; la structure de cette region C-terminale 
predite par le logiciel Predator est une longue region coudee 
contenant une Q^"* feuillet p. 

Dans le cas du gene hOBPIIb, en plus de I'ARNm hOBPIIba 
25 prealablement decrit, un exon sumumeraire de 106 pb (exon 3b) 
entre les precedents exons 3 et 4 a ete identifie (figure 3). Cet ARNm 
plus long (782 nucleotides) code pour une proteine hOBPIIbp de 
165 amino-acides. Du point de vue de la structure proteique, 
hOBPIIbp est identique a hOBPIIba jusqu'au 5*««^ feuillet p putatif 
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puis differe ensuite a cause d'un d6calage du cadre de lecture. Les 
predictions des logiciels informatiques indiquent que le motif 
ALWEALAIDTRLK est une helice a qui est juste derriere le 
cinquieme feuillet |5. Deux feuillets p additionnels peuvent etre 

5 presents dans la longue partie C-terminale. 

Aucun des variants d'epissage alternatifs pour un gene n'est 
detecte symetriquement pour I'autre gene bien que les sites 
d'epissage accepteur et donneur putatifs puissent etre presents 
(figure 3). En plus de ces motifs proteiques qui conservent la 

10 structure traditionnelle d'une lipocaline, nous avons demontre, 
pour les deux genes hOBPIla et hOBPlIb, I'existence d'une faible 
quantite d'ARNm ayant subi un epissage altematif et codant pour 
des proteines dont la sequence n'est pas directement li€e aux 
lipocalines. Des ARNm codant pour hOBPIIaS et hOBFIIby 

15 auxquels ils manquent la sequence codant pour I'exon 2 et qui 
possedent respectivement I'exon 5b et I'exon 5 cedent pour des 
proteines putatives secretees de 147 et de 85 amino-acides 
respectivement (figures 4 et 5) ; ces proteines divergent des 
proteines precedentes a partir du 24*"'« amino-acide. 

20 Pour identifier les cellules exprimant les genes hOBPII, les 

inventeurs ont hybride des sondes ribonucleiques sens et anti-sens 
marquees a la digoxygenine sur des sections tissulaires (figure 7). 
Les ARNm hOBPIl sont detectes dans les cellules acineuses du 
meat moyen et des comets nasaux ainsi que des cellules 

25 epitheliales des comets ; ceci soutient I'idee que les proteines 
hOBPII sont impliquees dans la fonction olfactive. En plus de la 
production dans la sphere orale, des ARNm codant pour hOBPII ont 
ete detectes dans la sphere genitale, notamment dans les cellules 
glandulaires de la prostate, dans les cellules secretrices epitheliales 
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du canal deferent. Aucun signal n'a ete detecte dans les gonades 
males, ce qui suggere que I'expression des genes hOBPII mise en 
evidence dans les experiences de RT-PCR correspondait a la 
presence de canaux additionnels dans la preparation tissulaire (rete 
testis et canaux efferents). En combinant ces resultats de la 
detection de I'ensemble des ARNm codant pour hOBPII avec ceux 
de rapproche RT-PCR, il est apparu que cinq proteines hOBPII 
(hOBPIIaa, hOBPIIap, hOBPIIay, hOBPIIba, hOBPIIbp) sont 
secretees par les cellules epitheliales des canaux des gonades 
males, ainsi que des cellules acineuses du meat moyen et des 
comets nasaux ; dans ces cellules les ARNm codant pour hOBPIIa 
sont hautement predominant. Seules les deux proteines hOBPIIb 
(hOBPIIba et hOBPIIbP) sont secretees par les cellules epithelio- 
glandulaires de la prostate et des glandes mammaires. 



20 



EXEMPLE6: ANALYSE PHYLOGENETIQUE ET 

CLASSIFICATION DES LIPOCALINES 

L'analysc en dotplot (figure 2) ainsi que les duplications 
genomiques que nous avons revelees indiquent une engine 
commune des genes LCNl et hOBPII. Pour clarifier les relations 
entre les membres de la famille des lipocalines et pour verifier que 
nous avons identifie le gene humain orthologue de OBPII de rat 
(Dear et cd., 1991), nous avons construit un arbre de distance 
25 phylogenetique avec les lipocalines des vertebres (figure 8). 

Us inventeurs ont mis en evidence neuf groupes principaux 
de lipocalines issus d'un precurseur commun : 

la famille de I'apolipoproteine et de la proteine de liaison au 
retinol (RBP) (groupe 1) ; 
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le groupe de la prostaglandine D-synthase et du precurseur 
de lipocaline associe a la gelatinase des neutrophiles (groupe 

2); 

la sous-famUle de I'alpha-l-microglobuline/bikunin 

5 (proteine HC) (groupe 3) ; 

la sous-famille orosomucoide (AlAG, AlAH, AlAI) (groupe 4) 
la sous-famille de la sphere orale 1 (OBPII-type- 
LCNl/VEGP, VNSP 1 et II, LALP, CanFl) (groupe 5) ; 
la sous-famille de la lactoglobuline (groupe 6) ; 

10 - la sous-famille des proteines secretees par I'epididyme de 
lezard (groupe 7) ; 

la sous-famille la sphere orale 2 (proteines urinaires 
majeures (MUP) de souris) (groupe 8) ; 

la sous-famille de la sphere orale 3 (OBPl, OBPII de souris, 
15 Aphrodisine, Probasine, BD20) (groupe 9). 

La presente invention conceme plus particulierement les 

groupes 5, 8 et 9. 

Le groupe 5 contient les proteines hOBPIl qui sont 
etroitement liees d'un point de vue evolutif a I'OBPII de rat. Pris 
20 dans leur ensemble, les presents resultats indiquent que les genes 
hOBPIl humains sont orthologues du gene OBPII de rat. Ce groupe 
contient egalement les proteines LCNl-VEGP de differentes especes. 
En prenant en consideration I'organisation genomique des genes 
hOBPII-LCNl, les donnees de I'arbre illustrent l*evenemcnt de 
25 duplication (fleche) qui donne naissance aux genes ancestraux 
hOBPII et LCNl a partir de leur precurseur lipocaline commun 
(Figure 9). Plus recemment, les duplications origineUes de la region 
de 50 kb contenant hOBPlI-LCNl (fleche) ont genere chez ITiomme 
les deux genes hOBPII et le gene LCNl et son pseudogene LCNlb. 
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La duplication additionnelle ayant donne lieu au pseudogene 
LCNlc est partielle dans le genome humain et ne produit pas de 
proteine fonctionnelle et est done absente du present arbre. De 
plus, les deux proteines VEG du rat sont plus etroitement liees 
5 Tune a Tautre dans Tarbre phylogenetique qu'avec la proteine 
humaine LCNl. La situation est identique pour les deux profeines 
humaines OBPII par rapport a la proteine OBPII de rat. Ces 
resultats sont en faveur d'un processus de conversion genique pour 
au moins certains genes des lipocalines. Ceci peut egalement etre 

10 correle au fait que ces genes se situent sur le meme bras 
chromosomique. 

Le groupe 9 correspond a la famille de la sphere orale 3 et 
contient des OBP qui ont deja ete decrites. La proteine Aphrodisine 
a deja ete decrite comme un transporteur de pheromone (Henzel et 

15 al, 1988) et apparait etre orthologue a la proteine OBPl de rat et 
de souris, avec deux genes OBPl paralogues. Finalement, les 
lipocalines olfactives produites par les glandes de Bowman de rana 
pipens (OLFA RANPI) qui sont considerees comme des 
transporteurs d'odeurs potentiels dans le mucus de la grenouille, 

20 ne sont liees a aucun groupe d'OBP putatif (groupes 5, 8 et 9) 
suggerant ainsi Texistence d'autres categories d'OBP. 

Certaines lipocalines ont ete decrites comme allergenes, 
L'allergene majeur du chien, la proteine CanFl majoritairement 
exprimee dans les glandes de von Ebner (Konieczny et al, 1997), 

25 apparait dans Tarbre etre la proteine VEG du chien. Ce resultat 
montrant que LCNl peut etre allergenique, pousse les inventeurs a 
proposer I'implication des proteines OBPII dans les processus 
allergiques. De la meme maniere, Tallergene majeur du cheval 
EquCl exprime dans le foie, dans les glandes salivaires (Gregoire et 
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al, 1996) apparait etre orthologue a un membre de la proteine MUP 
(groupe 3). L'allergene majeure de la vache (BD20 BOSTA) qui est 
present dans la famille de la sphere orale 2 (groupe 4) est 
davantage lie a la probasine. CanF2 principalement exprimee dans 
5 la glande parotide (Konieczny et al, 1997) ne semble pas etre 
orthologue a une lipocaline prealablement decrite. 

La presente invention a permis de revele Texistence d*une 
duplication genomique au locus q34 du chromosome 9 humain qui 
recele une famille de gene du type LCNl ; cette famille comporte 

10 outre le gene LCNl, precedemment decrit, deux pseudogenes ainsi 
que deux genes hOBPII qui sont paralogues a LCNl. Les inventeurs 
ont revele que la famille hOBPII-LCNl resulte d'evenements 
consecutifs de duplications genomiques- Les sequences ainsi que 
Torganisation genomique ont revele que les genes LCNl et hOBPII 

15 derivent d'un ancetre commun et ont ete genere au moyen de 
duplication en tandem. Les comparaisons de sequences ont 
demontre que les proteines hOBPIIaa et hOBPIIba sont les formes 
de proteines des hOBPII les plus proches de LCNl; ceci est 
corrobore par le fait que la taille de Texon 5 de LCNl est de 121 pb, 

20 ce qui correspond a la taille de Texon 5a de la proteine hOBPII et 
par le fait qu'aucun exon 3b n'ait etc trouve dans la proteine LCNl, 
Des resultats similaires sont obtenus lorsque cette comparaison est 
effectuee avec les sept autres exons des lipocalines. Ces donnees 
sont en faveur d?une acquisition de la diversite des proteines 

25 hOBPII a travers integration de d'ADN genomique additionnel 
environnant au niveau du site accepteur d'epissage amont pour 
Texon 5 de hOBPIIa ou a travers le recrutement d'un exon 
sumumeraire (exon 3b) pour la proteine hOBPIIb. LTiypothese d'un 
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recrutement d'exons plutdt qu'une reduction de la taille des exons 
ou qu'une perte d'exons est plus probable. 

Les inventeurs ont montrc que les genes hOBPII et LCNl 
codent pour des proteines impliquees dans differentes fonctions, 
5 comme le montre I'expression de ces genes a la fois dans la sphere 
orale et dans la sphere genitale. De plus, les inventeurs ont montre 
par I'analyse phylogenetique (exemple 6) que plusieurs proteines 
differentes pouvaient participer a la meme fonction d'odorant- 
binding proteine ; ainsi trois sous-families de lipocalines (les 
10 groupes 5, 8 et 9) correspondent a plusieurs proteines sont 
retrouvees exprimees dans la sphere orale et notamment dans les 
glandes nasales et buccales. 

Cette analyse montrant que plusieurs lipocalines participent 
a une meme fonction physiologique et qu'une meme proteine 
15 pouvait participer a differentes fonctions, a conduit les inventeurs a 
analyser Texpression des autres lipocalines humaines dans 
I'ensemble des tissus etudies (Figure 10). Ceci a conduit a montrer 
que le gene codant pour Tapolipoproteine D est exprime dans les 
glandes du comet nasal et du meat moyen, en faisant ainsi une 
20 potentielle odorant-binding proteine. De mSme la retinol-binding 
proteine (RBP) est exprimee par I'epithelium nasal et pourrait aussi 
participer a cette fonction. 

Les inventeurs proposent done d'inclure les proteines ApoD 
et RBP dans la famille des OBP humaines et les incluent dans 
25 I'ensemble des revendications portant sur ces OBP humaines. 

Les inventeurs ont demontre que la transcription des deux 
genes hOBPII genere de nombreux transcrits altematifs qui codent 
pour des proteines distinctes dont la structure est compatible avec 
celle d'un transporteur de ligand hydrophobe. 
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Les inventeurs ont mis en evidence Texpression des deux 
genes hOBPII dans la sphere orale (glandes nasales, glandes de von 
Ebner, glandes sous-maxillaircs, glandes lacrymales, poumon). Les 
inventeurs ont egalement demontre que les proteines hOBPIl selon 

5 I'invention sont produites par les cellules de la sphere genitale ; le 
gene hOBPII est majoritairement exprime dans la prostate, le canal 
deferent et les glandes mammaires alors que I'expression du gene 
hOBPIla est restreinte au canal deferent. Les analyses in situ ont 
revdle que I'ARNm est produit par les cellules glandulaires de la 

10 prostate et des cellules secr^trices cpitheliales du canal deferent 
supportant Tidee d'une secretion des proteines correspondantes 
dans le fluide seminal. Les proteines selon I'invention sont done 
susceptibles d'etre impliquees dans la fonction de reproduction, 
mais egalement dans toutes les autres fonctions habituellement 

15 attribuees aux lipocalines. 



EXEMPLB7: FABRICATION D'UNE PROTEINE 

RECOMBINANTE HOBPIIBa DANS UN SYSTEME 
20 PROCARYOTB. 

Une PGR sur I'ADN plasmidique d'un clone de hOBPIIba a 
I'aide des amorces Blla/b (5' GTC GGA TCC CTG TCC TTC ACC 
CTG GAG G a*), oligonucleotide sens demarrant 45 bases apres 
I'ATG initiant la proteine, et Xllb ( 5' GTC CTG GAG GTG TTC GGG 
25 AAC GCA GCT TC S*), oligonucleotide antisens precedant le codon 
stop de la proteine hOBPIIba, a permis d'amplifier la totalite de 
I'ADN codant pour la proteine hOBPIIba sdcretee. Les sites de 
restriction enzymatique BamH I et Xho 1 situes aux extremites des 
deux oligonucleotides (bases soulignees), furent utilises pour un 
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clonage directionnel dans un vecteur plasmidique d'expression 
pGEX-6Pl, suivi d'une transformation par electroporation (1800V, 
200O, 25|LiF) dans une souche bacterienne BL21. La synthase de la 
proteine recombinante est obtenue par ajout dlPTG a raison de 5 
5 mM final pendant 3 h dans 250 ml de culture de la souche en 
milieu LB contenant 100 Mg/ml d'ampicilline prealablement 
incubee a 37°C pendant 2 h. Les cultures centrifugees sent reprises 
dans 25 ml de tampon TENGN. Le lysat est sonique et centrifuge a 
nouveau. La proteine de fusion est alors purifiee a Taide de 4 ml de 

10 billes fixant de fagon covalente du glutathion insoluble (Sigma) pour 
25 ml de sumageant. Apres 4 h d'incubation, elles sont lavees avec 
3 volumes de NaCl IM puis par 10 volumes de PBS IX, L'elution 
est obtenue par mise en contact des billes pendant 10 min avec une 
solution de glutathion (Glutathion reduit 10 mM, Tris-HCl pH 8,0 

15 50 mM). 

La quantite de proteine recombinante produite est estimee 
par migration en gel de polyaciylamide et coloration au blfeu de 
Coomassie (Figure 11). La specificite de Tinduction d*une proteine 
recombinante est testee par Western blot a Taide d'un anticorps 

20 anti-GST de chevre (Figure 1 1), revele avec un anticorps anti-IgG de 
chevre couple a la peroxydase en utilisant un kit ECL+plus 
(Amersham). La separation de la proteine de fusion en deux 
proteines est obtenue par proteolyse de 100 ixg de proteine 
recombinante prealablement dialysee a Taide de 2U de 

25 preScission™ protease (Pharmacia Biotech) dans 10 ixl final 
contenant du tampon de Tenzyme IX, pendant 4 h a S^'C. 

EXEMPLE 8 : DETECTION DES hOBPII DANS DIFFERENTS 
TISSUS PAR IMMUNOHISTOCHIMIE* 
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La localisation des proteines hOBPu au sein des structures 
nasales (figures 12 et 15), des structures buccales et des glandes 
lachrymales (figures 13 et 18), des glandes mammaires et des 
poumons (figures 14 et 18) est revelee par immunohistochimie, 

5 

EXBMPLE 9 : DETECTION DES hOBPII, LCNl ET ApoD, AU 
SEIN DES STRUCTURES NASALES PAR RT-PCR, 
ET PAR IMMUNOHISTOCHIMIE. 

10 Les RT-PCR realisees a Taide des jeux d'amorces pour les 

hOBPII et pour LCNl revelent la presence des ARNm 
correspondants dans au moins une des structures nasales. Les 
techniques de detection immunohistochimiques tant par detection 
de fluorescence que par revelation a Taide de peroxidase et de DAB, 

15 revelent la presence des proteines hOBPII (figure 15) et LCNl (figure 
16) dans les cellules epitheliales des acini des glandes nasales, 
ainsi que dans les lumieres des canaux secreteurs. On peut 
egalement en detecter sur du mucus colle sur les tissus, 

Les RT-PCR realisees a Taide des jeux d'amorces pour 

20 rApolipoproteineD revelent la presence des ARNm correspondants 
dans au moins une des structures nasales. Les techniques de 
detection immunohistochimiques par revelation a Taide de 
peroxidase et de DAB, revelent la presence de la proteine ApoD 
(figure 17) dans les cellules epitheliales des acini des glandes 

25 nasales, ainsi que dans les lumieres des canaux secreteurs, bien 
que Texpression semble plus faible et dans moins d'acini que pour 
les hOBPIL 
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EXEMPLE 10 : DETECTION DES hOBPII, LCNl, ApoD DANS LE 
PLACENTA PAR RT-PCR ET PAR 
IMMUNOHISTOCHIMIE. 

Us RT-PCR realisees a I'aide des jeux d'amorces pour les 

5 hOBPII et pour LCNl revelent la presence des ARNm 
correspondants dans le placenta. Les techniques de detection 
immunohistochimiques par revelation a I'aide de peroxidase et de 
DAB, revelent la presence des proteines hOBPII (figure 19) et LCNl 
(figure 20) tres fortement au niveau des lacunes des villosites 

10 placentaires et beaucoup plus faiblement et de fagon tres diffuse au 
niveau des ceUules epitheliales de la membrane amniotique et de 
cellules sous jacentes tant pour la membrane amniotique que pour 
le cordon. L'expression des ARNm d6tectes par RT-PCR au niveau 
des villosites placentaires indique que ces proteines hOBPIl sont 

15 produites par le placenta pour transferer des molecules lipophiles 
(hormones, acides gras, vitamines...) vers le foetus par le biais de la 
circulation sanguine fcetale. Les prot6ines detectees au niveau de la 
membrane amniotique pourraient correspondre k I'absorption de 
ces proteines a partir du liquide amniotique, sachant que les 

20 structures nasales du foetus sont baignees par ce liquide 
amniotique. Les proteines hOBPII et LCNl participeraient ainsi au 
transport de substances lipophiliques de petite taille de la mere 
vers le foetus au niveau des villosites choriales par llntermediaire 
du sang foetal, et du foetus vers la mere par I'intermediaire du 

25 liquide amniotique. 

Les RT-PCR realisees a I'aide des jeux d'amorces pour la 
proteine ApoD revelent la presence des ARNm correspondants dans 
le placenta. Les techniques de detection immunohistochimiques par 
revelation a I'aide de peroxidase et de DAB, revelent la presence de 
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la protcine ApoD tres fortement au niveau des lacunes des villosites 
placentaires (figure 21). La proteine ApoD n'est pas detectee au 
niveau des cellules de la membrane amniotique et de cellules sous 
jacentes tant pour la membrane amniotique que pour le cordon. 
5 L'expression des ARNm detectes par RT-PCR au niveau placentaire 
indique que la proteine ApoD est produite par le placenta pour 
transferer des molecules lipophiles (hormones, acides gras, 
vitamines...) vers le foetus par le biais de la circulation sanguine 
foetale. La proteine ApoD peut egalement etre produite par le foie du 

10 foetus. La proteine ApoD participerait ainsi au transport de 
substances lipophiUques de petite taille de la mere vers le foetus au 
niveau des villosites choriales par Tintermediaire du sang foetal. 

Plus generalement, l'expression de lipocalines par le 
placenta, telles que I'Alphal-acid Glycoproteine (AlAG), la 

15 prostaglandine D-synthase (PODS), PPM et RBP comme revelee par 
les techniques de RT-PCR indique que ces proteines aux proprietes 
de transporteur de molecules hydrophobes sont massivement 
recrutees pour les relations mere-enfant, pour les transports de ces 
molecules comme peuvent etre des hormones steroides, des acides 

20 gras, des vitamines ou des xenobiotiques et plus generalement des 
produits de detoxification issus du metabolisme. 
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REVBNDICATIONS 

1. Polypeptide isole comprenant une sequence en amino- 
acides ayant au moins 90% d'identite avec les sequences en amino- 

5 acides SEQ ID N° 2, SEQ ID 4, SEQ ID N° 6, SEQ ID 8, SEQ 
ID 12 ou SEQ ID N** 14. 

2. Polypeptide isole caracterise en ce qu'il comprend un 
polypeptide choisi parmi : 

10 a) un polypeptide de sequence SEQ ID N° 2, SEQ ID N° 4, 

SEQ ID 6, SEQ ID 8, SEQ ID 12 ou SEQ ID 14; 

b) un polypeptide variant de poljrpeptide de sequences 
d'acides amines defini en a) ; 

c) un pol3rpeptide homologue au polypeptide deflni en a) ou 
15 b) et comportant au mdihs 90 % d'identite avec ledit polypeptide de 

a); 

d) un fragment d'au moins 15 acides amines consecutifs 
d'un polypeptide defini en a), b) ou c) ; 

e) un fragment biologiquement actif d'un polypeptide defini 
20 en a), b) ou c), 

3. Polypeptide isole selectionne parmi un polypeptide 
correspondant a la sequence SEQ ID N'*2 et denomme OBPIIaa , a la 
sequence SEQ ID N*'4 et denomme OBPIIap , a la sequence SEQ ID 

25 N**6 et denomme OBPIIay, a la sequence SEQ ID N° 12 et denomme 
OBPIIbp . 
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4. Polypeptide selon I'une quelconque des revendications 1 a 
3 caracterise en ce qu'il comporte au moins le domaine Gly-Thr- 
Trp-Tyr. 

5 5- Polynucleotide isole caracterise en ce qu'il code pour un 

polypeptide selon I'une quelconque des revendications 1 a 4. 

6. Polynucleotide selon la revendication 5 de sequence SEQ 
ID N" 1, SEQ ID N° 3 , SEQ ID N° 5, SEQ ID N" 7, SEQ ID 11 ou 

10 SEQ ID N" 13. 

7. Polynucleotide isole caracterise en ce qu'il comprend un 
polynucleotide choisi parmi : 

a) un polynucleotide de sequence SEQ ID N" 1, SEQ ID N" 
15 3 , SEQ ID N" 5, SEQ ID N»7, SEQ ID NMl ou SEQ ID N" 13 ou 

dont la sequence est celle de I'ARN correspondant a la sequence 
SEQ ID N" 1, SEQ ID 3 , SEQ ID N" 5, SEQ ID N"?, SEQ ID N^l 1 
ou SEQ ID N" 13 ; 

b) un polynucleotide dont la sequence est complementaire 
20 de la sequence d'un polynucleotide defini en a), 

c) un polynucleotide dont la sequence comporte au moins 
80% d'identite, avec un polynucleotide defini en a) ou b), 

d) un fragment d'au moins 15 nucleotides consficutifs, de 
preference 21 nucleotides consecutifs, et de maniere pr^feree 30 

25 nucleotides consecutifs d'un polynucleotide defini en a), b), c) ou d). 

8. Pol3niucleotide selon la revendication 7 caracterise en ce 
qu'il est marque directement ou indirectement par un compose 
radioactif ou un compose non radioactif. 
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9. Utilisation d'un polynucleotide selon la revendication 8 en 
tant que sonde pour la detection de sequences nucleiques. 

10. Utilisation d'un polynucleotide selon Tune quelconque 
5 des revendications 5 a 8 en tant qu'amorce pour I'amplification ou 

la pol3nnerisation de sequences nucleiques. 

11. Utilisation d'un polynucleotide selon la revendication 8 
en tant que oligonucleotide sens ou antisens pour controler 

10 I'expression du produit proteique correspondant. 

12. Vecteur recombinant de clonage d'un pol3mucleotide 
selon I'une des revendications 5 a 8 et/ou d'expression d'un 
polypeptide selon I'une des revendications 1 a 4 caracterise en ce 

15 qu'il contient un polynucleotide selon I'une quelconque des 
revendications 5 a 8. 

13. Vecteur selon la revendication 12 caracterise en ce qu'il 
comporte les elements permettant I'expression eventuellement la 

20 secretion dudit polypeptide dans une cellule bote. 

14. Vecteur selon I'une quelconque des revendications 12 a 
13 caracterise en ce que les elements permettant I'expression dudit 
polypeptide sont choisis parmi : 

25 a) le poljoiucleotide isole de sequence SED ID N'lS at SEQ 

ID N° 16; 

b) un polynucleotide dont la sequence est complementaire 
de la sequence du polynucleotide defini en a) ; 
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c) un polynucleotide dont la sequence comporte au moins 
80% d'identite avec un polynucleotide defini en a) ou en b) ; 

d) un polynucleotide hybridant dans des conditions de forte 
stringence avec une sequence du polynucleotide defini en a), b) ou 

5 c). 

15. Vecteur selon les revendications 13 et 14 pour 
Texpression dans les cellules eucaiyotes selectionnes parmi TADN 
viral et TADN nu, 

10 

16. Cellule hote, caracterisee en ce qu'elle est trsinsformee 
par un vecteur selon Tune des revendications 12 a 15, 

17. Procede de preparation d'un polypeptide recombinant 
15 caracterise en ce que Ton cultive une cellule bote selon la 

revendication 16 dans des conditions permettant Texpression et 
eventuellement la secretion dudit polypeptide recombinant et que 
Ton recupere ledit polypeptide recombinant. 

20 18. Polypeptide recombinant susceptible d'etre obtenu par 

un procede selon la revendication 17. 

19. Utilisation d'un polypeptide choisi parmi un polypeptide 
selon I'une quelconque des revendications 1 a 4 et 18 ou Tun de ses 

25 fragments, comme proteine de liaison a un ligand hydrophobe de 
preference une molecule odorante. 

20. Utilisation d'un polypeptide selon Tune quelconque des 
revendications 1 a 4 et 18, ou du polypeptide hOBPIIba de sequence 
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SEQ ID N** 10, un polypeptide variant dudit polypeptide hOBPIIta, 
un polypeptide homologue audit polypeptide hOBPIIba comportant 
au moins 90% d'identite avec ledit polypeptide hOBPIIba ou l\in de 
ses fragments, comme inhibiteur competitif comme, agoniste ou 
5 antagoniste des recepteurs cellulaires aux lipocalines. 

21. Anticorps monoclonal ou polyclonal et ses fragments 
caracterise en ce qu'il est dirige specifiquement contre un 
polypeptide isole selon Tune des revendications 1 a 4 et 18. 

10 

22. Utilisation d'un anticorps selon la revendication 21 pour 
la mise en evidence de la presence d'un polypeptide selon Tune des 
revendications 1 a 4 et 18 dans un echantillon biologique. 

15 23. Procede de detection d'anticorps dirige contre hOBPII 

dans le serum humain de patient allergique et/ou asthmatique en 
utilisant un polypeptide hOBPIL 

24. Procede pour controler la volatilisation d'une bdeur 
20 caracterise en ce qu'il comprend une etape de liaison de ladite 

odeur avec un polypeptide selon Tune quelconque des 
revendications 1 a 4 et 18, ou avec le pol3rpeptide hOBPIIba de 
sequence SEQ ID N° 10, un polypeptide variant dudit polypeptide 
hOBPIIba, un polypeptide homologue audit poliT^eptide hOBPIIba 
25 comportant au moins 90% dldentite avec ledit polypeptide 

hOBPIIba. 

25. Procede selon la revendication 24 caracterise en ce que 
le polypeptide est lie a un support solide. 
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26. Procede selon la revendication 24 caracterise en ce que 
le polypeptide est dans une composition liquide. 

5 27. Procedfi selon la revendication 26 caracterise en ce que 

ladite composition est une composition parfumee pour la peau. 

28. Procede de criblage de molecule, de preference les 
odeurs ou saveurs qui comprend de passer la molecule sur un 

10 substrat qui comprend un polypeptide selon l*une quelconque des 
revendications 1 a 4 et 18, ou le polypeptide hOBPIIba de sequence 
SEQ ID N° 10, un polypeptide variant dudit polypeptide hOBPIIba, 
un polypeptide homologue audit polypeptide hOBPIIba comportant 
au moins 90% d'identite avec ledit polypeptide hOBPIIba, lie audit 

15 substrat, ledit polypeptide liant ladite odeur ou saveur et recupdrer 
ladite odeur ou saveur depuis le polypeptide si necessaire. 

29. Procede selon la revendication 28 caracterise en ce que 
les molecules sont des phdromones humaines. 

20 

30. Procede pour solubiliser des molecules lipophiles 
caracterise en ce qu'il comprend la liaison de ladite molecule a un 
polypeptide selon I'une quelconque des revendications 1 a 4 et 18, 
ou au polypeptide hOBPIIba de sequence SEQ ID 10, un 

25 polypeptide variant dudit polypeptide hOBPIIba, un polypeptide 
homologue audit polypeptide hOBPIIba comportant au moins 90% 
d'identite avec ledit pol3T)eptide hOBPIIba. 
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31- Application des polypeptides selon Tune des 
revendications 1 a 4 et 18, ou du polypeptide hOBPIIba de sequence 
SEQ ID N*^ 10, d'un polypeptide variant dudit polypeptide hOBPIIba, 
d'un polypeptide homologue audit polypeptide hOBPIIba comportant 
5 au moins 90% d'identite avec ledit polypeptide hOBPIIba en 
combinaison avec des acides gras alimentaires, a titre d'additif 
alimentaire. 

32. Application selon la revendication 31 pour la 
10 preparation d'un medicament destine au traitement des 
hyperlipidemies et de Tobesite. 

33- Application selon la revendication 31 pour 
complementer les laits non-maternels. 

15 

34. Polypeptide selon Tune quelconque des revendications 1 
a 4 et 18, ou le polypeptide hOBPIIba de sequence SEQ ID N** 10, un 
polypeptide variant dudit polypeptide hOBPIIba, un polypeptide 
homologue audit polypeptide hOBPIIba comportant au moins 90% 

20 d'identite avec ledit polypeptide hOBPIIba en tant qu'agent de 
ciblage de compose pharmaceutique, 

35. Polypeptide selon la revendication 34 caracterise en ce 
que ledit polypeptide est exprime sous la forme d'une proteine de 

25 fusion avec une proteine permettant un adressage cellulaire 
specifique. 

36. Polypeptide selon la revendication 35 caracterise en ce 
que ladite proteine permettant un adressage cellulaire specifique 
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est choisie dans le groupe compose des interleukines, des 
cytokines, des Ijnnphokines, des interferons, des facteurs de 
croissance, des hormones, des anticorps. 

5 37. Polypeptide selon la revendication 34 caracterise en ce 

que ledit polypeptide est associe a une molecule permettant un 
adressage cellulaire specifique. 

38. Polypeptide selon la revendication 37 caracterise en ce 
10 que ladite molecule permettant un adressage cellulaire specifique 
est choisie dans le groupe compose des steroides, des interleukines, 
des cytokines, des Ijnnphokines, des interferons, des facteurs de 
croissance, des hormones, des anticorps. 

15 39. Polypeptide "selon Tune quelconque des revendications 1 

a 4 et 18, ou le polypeptide hOBPIIba de sequence SEQ ID N° 10, un 
polypeptide variant dudit polypeptide hOBPIIba, un polypeptide 
homologue audit polypeptide hOBPIIba comportant au moins 90% 
d'identite avec ledit polypeptide hOBPIIba en tant que transporteur 

20 de compose pharmaceutique. 

40. Composition pharmaceutique comprenant un compose 
pharmaceutique lie au moins a un polypeptide selon Tune des 
revendications 34 a 39 et un vehicule pharmaceutiquement 

25 acceptable. 

41, Composition pharmaceutique selon la revendication 40 
caracterisee en ce que le compose pharmaceutique est choisi dans 
le groupe des agents anticancereux. 
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42. Composition pharmaceutique selon la revendication 41 
caracterisee en ce que ledit agent anticancereux est un isotope 
radioactif choisi parmi le groupe : riode^^i, ITttrium^o, rOr^^^, le 

5 Palladium^oo^ le Cuivre67, le Bismuth2i7 et TAntimoine^ii. 

43. Composition pharmaceutique selon Tune quelconque 
des revendications 40 a 42 caracterisee en ce que ledit polypeptide 
selon Tune quelconque des revendications 34 a 39 constitue une 

10 forme retard de delivrance dudit compose pharmaceutique dans 
Torganisme. 

44. Composition pharmaceutique comprenant un vecteur 
d'expression selon les revendications 12 ou 13 et un vehicule 

15 pharmaceutiquement acceptable. 

45. Composition pharmaceutique selon Tune quelconque 
des revendications 40 a 44 pour le traitement du cancer choisi de 
preference parmi le cancer du sein, le cancer de Tuterus, le cancer 

20 de la prostate, le cancer du foie, du carcinome des cellules 
epitheliales pulmonaires. 

46. Utilisation d'un polypeptide choisi parmi le polypeptide 
hOBPIIba de sequence SEQ ID N** 10, un polypeptide variant dudit 

25 polypeptide hOBPIIba, un polypeptide homologue audit polypeptide 
hOBPIIba comportant au moins 90% d'identite avec ledit polypeptide 
hOBPIIba, pour la preparation d'un medicament destine au 
traitement du cancer de I'uterus, du cancer de la prostate, du 
cancer du foie, du cancer des cellules epitheliales pulmonaires. 
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47. Utilisation du polypeptide selon I'une quelconque des 
revendications 1 a 4 et 18, ou le polypeptide hOBPIIba de sequence 
SEQ ID N° 10, ou un polypeptide variant dudit polypeptide 
5 hOBPIIba, ou un polypeptide homologue audit polypeptide hOBPIIb« 
comportant au moins 90% d'identite avec ledit polypeptide hOBPIIba 
pour la preparation d'un medicament destine au transport de 
compose a travers la barriere placentaire. 

[0 48. Utilisation selon la revendication 47 caracterisee en ce 

que ledit transport est reaUse de la mere gestante vers le foetus et 
que ledit compose est choisi parmi les hormones, les acides gras 
essentiels, les medicaments UpophUes, les vitamines. 

15 49, utilisation selon la revendication 47 caract6risee en ce 

que ledit transport est realise du foetus vers la mere et est destine a 
la detoxifixation du foetus. 

50. Polypeptide selon les revendications 1 a 4 et 18, ou le 
20 polypeptide hOBPIIba de sequence SEQ ID N" 10, un polypeptide 
variant dudit polypeptide hOBPIIba, un polypeptide homologue 
audit polypeptide hOBPIIba comportant au moins 90% d'identite 
avec ledit polypeptide hOBPIIba en tant que marqueur de grossesse. 

25 51. Polypeptide selon les revendications 1 a 4 et 18, ou le 

polypeptide hOBPIIba de sequence SEQ ID 10, un polypeptide 
variant dudit polypeptide hOBPIIba, un polypeptide homologue 
audit polypeptide hOBPIIba comportant au moins 90% d'identite 
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avec ledit polypeptide hOBPIIba en tant que marqueur de pathologie 
foeto-placentaire. 
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LI STAGE DE SEQUENCES 
<110> UNIVERSITE D'AUVERGNE CLERMONT I 

<120> « ODORANT-BINDING » PROTEINES HUMAINES FIXANTS DES LIGANDS 
HYDROPHOBES : 

POLYPEPTIDES ET POLYNUCLEOTIDES CODANT LESDITS POLYPEPTIDES, ET LEURS 
APPLICATIONS 

<130> D15947 

<160> 16 

<170> Patentin Vers. 2.0 

<210> 1 
<211> 676 
<212> ADN 

<213> Homo sapiens 

<220> 

<221> CDS 

<222> (43) . . (552) 

<223> CDNA396 (676) /gl (hOBPI la-alpha) 

<400> 1 ^ tiA 

cacccagtga cctgccgagg tcggcagcac agagctctgg ag atg aag acc ctg 54 
^ Met Lys Thr Leu 

1 

ttc ctg ggt gtc acg etc ggc ctg gcc get gcc ctg tec ttc acc ctg 102 
Phe Leu Gly Val Thr Leu Gly Leu Ala Ala Ala Leu Ser Phe Thr Leu 
5 10 15 20 

gag gag gag gat ate aca ggg acc tgg tac gtg aag gcc atg gtg gtc 150 
Glu Glu Glu Asp He Thr Gly Thr Trp Tyr Val Lys Ala Met Val Val 
25 30 35 

gat aag gae ttt ccg gag gac agg agg cec agg aag gtg tec cea gtg 198 
Asp Lys Asp Phe Pro Glu Asp Arg Arg Pro Arg Lys Val Ser Pro Val 
40 45 50 

aag gtg aca gcc ctg ggc ggt ggg aac ttg gaa gee acg ttc ace ttc 246 
Lys Val Thr Ala Leu Gly Gly Gly Asn Leu Glu Ala Thr Phe Thr Phe 
55 60 65 

atg agg gag gat egg tge ate eag aag aaa ate ctg atg egg aag acg 294 
Met Arg Glu Asp Arg Cys He Gin Lys Lys He Leu Met Arg Lys Thr 
70 75 80 

gag gag cet ggc aaa ttc age gee tat ggg ggc agg aag etc ata tac 342 
Glu Glu Pro Gly Lys Phe Ser Ala Tyr Gly Gly Arg Lys Leu He Tyr 
85 90 95 100 

ctg eag gag ctg cec ggg acg gac gae tac gtc ttt tac tge aaa gae 390 
Leu Gin Glu Leu Pro Gly Thr Asp Asp Tyr Val Phe Tyr Cys Lys Asp 
105 110 115 
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2 



cag cgc cgt ggg ggc ctg cgc tac atg gga aag ctt gtg ggt agg aat 
Gin Arg Arg Gly Gly Leu Arg Tyr Met Gly Lys Leu Val Gly Arg Asn 
120 125 130 



438 



486 



534 



cct aat acc aac ctg gag gcc ctg gaa gaa ttt aag aaa ttg gtg cag 
Pro Asn Thr Asn Leu Glu Ala Leu Glu Glu Phe Lys Lys Leu Val Gin 
135 140 145 

cac aag gga etc teg gag gag gac att ttc atg ccc ctg cag acg gga 
His Lys Gly Leu Ser Glu Glu Asp lie Phe Met Pro Leu Gin Thr Gly 
150 155 160 

age tgc gtt etc gaa cac taggcagccc cegggtctgc acctccagag 582 
Ser Cys Val Leu Glu His 
165 170 

cccaccctac caecagacac agagcccgga ecacetggae etaccctcca gecatgacce 642 
ttccctgetc ccacceacct gactccaaat aaag 676 



<210> 2 

<211> 170 

<212> PRT 

<213> Homo sapiens 

<400> 2 , , X 

Met Lys Thr Leu Phe Leu Gly Val Thr Leu Gly Leu Ala Ala Ala Leu 
1 5 10 15 

Ser Phe Thr Leu Glu Glu Glu Asp He Thr Gly Thr Trp Tyr Val Lys 
20 25 30 

Ala Met Val Val Asp Lys Asp Phe Pro Glu Asp Arg Arg Pro Arg Lys 
35 40 45 

Val Ser Pro Val Lys Val Thr Ala Leu Gly Gly Gly Asn Leu Glu Ala 
50 55 60 

Thr Phe Thr Phe Met Arg Glu Asp Arg Cys He Gin Lys Lys He Leu 
65 70 75 80 

Met Arg Lys Thr Glu Glu Pro Gly Lys Phe Ser Ala Tyr Gly Gly Arg 
85 90 95 

Lvs Leu He Tyr Leu Gin Glu Leu Pro Gly Thr Asp Asp Tyr Val Phe 
100 105 110 

Tyr Cys Lys Asp Gin Arg Arg Gly Gly Leu Arg Tyr Met Gly Lys Leu 
115 120 125 

Val Gly Arg Asn Pro Asn Thr Asn Leu Glu Ala Leu Glu Glu Phe Lys 
130 135 140 

Lvs Leu Val Gin His Lys Gly Leu Ser Glu Glu Asp He Phe Met Pro 
145 150 155 160 

Leu Gin Thr Gly Ser Cys Val Leu Glu His 
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165 170 



<210> 3 

<211> 725 

<212> ADN 

<213> Homo sapiens 

<220> 

<221> CDS 

<222> (43) . . <480) 

<223> CDNJU96 (725) /SM12 (hOBPIla-beta) 

<400> 3 ^ c>i 

cqcccagtga cctgccgagg tcggcagcac agagctctgg ag atg aag acc ctg 54 
^ Met Lys Thr Leu 

1 

ttc ctg ggt gtc acg etc ggc ctg gcc get gcc ctg tec ttc acc ctg 102 
Phe Leu Gly Val Thr Leu Gly Leu Ala Ala Ala Leu Ser Phe Thr Leu 
5 10 15 20 

gag gag gag gat ate aca ggg acc tgg tac gtg aag gcc atg gtg gtc 150 
Glu Glu Glu Asp He Thr Gly Thr Trp Tyr Val Lys Ala Met Val Val 
25 30 35 

gat aag gae ttt ccg gag gae agg agg ecc agg aag gtg tec cca gtg 198 
Asp Lys Asp Phe Pro Glu Asp Arg Arg Pro Arg Lys Val Ser Pro Val 
40 45 50 

aag gtg aca gee ctg ggc ggt ggg aac ttg gaa gcc acg ttc acc ttc 246 
Lvs Val Thr Ala Leu Gly Gly Gly Asn Leu Glu Ala Thr Phe Thr Phe 
55 60 65 

atg agg gag gat egg tgc ate cag aag aaa ate ctg atg egg aag acg 294 
Met Arg Glu Asp Arg Cys He Gin Lys Lys He Leu Met Arg Lys Thr 
70 75 80 

gag gag cct ggc aaa ttc age gcc tat ggg ggc agg aag etc ata tac 342 
Glu Glu Pro Gly Lys Phe Ser Ala Tyr Gly Gly Arg Lys Leu He Tyr 



85 



90 95 100 



ctg cag gag ctg cec ggg acg gae gae tac gtc ttt tac tgc aaa gae 390 
Leu Gin Glu Leu Pro Gly Thr Asp Asp Tyr Val Phe Tyr Cys Lys Asp 
105 110 115 

cag cge egt ggg ggc ctg cgc tac atg gga aag ctt gtg ggg ccg tgc 438 
Gin Arg Arg Gly Gly Leu Arg Tyr Met Gly Lys Leu Val Gly Pro Cys 
120 125 130 

cgc tgt cec cac gtc ggc tea cct ggc cac etc ace tgc agg 480 
Arg cys Pro His Val Gly Ser Pro Gly His Leu Thr Cys Arg 
135 140 145 

taggaatect aataccaace tggaggecct ggaagaattt aagaaattgg tgcagcacaa 540 

gggactctcg gaggaggaca ttttcatgee cctgcagacg ggaagctgcg ttctcgaaca 600 
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ctaggcagcc cccgggtctg cacctccaga gcccacccta ccaccagaca cagagcccgg 660 
accacctgga cctaccctcc agccatgacc cttccctgct cccacccacc tgactccaaa 720 

725 

taaag 

<210> 4 
<211> 146 
<212> PRT 

<213> Homo sapiens 

Met^Lvs Thr Leu Phe Leu Gly Val Thr Leu Gly Leu Ala Ala Ala Leu 
1 5 10 

ser Phe Thr Leu Glu Glu Glu Asp He Thr Gly Thr Trp Tyr^ Val Lys 
20 25 30 

Ala Met Val Val Asp Lys Asp Phe Pro Glu Asp Arg Arg Pro Arg Lys 
35 40 45 

Val ser Pro Val Lys Val Thr Ala Leu Gly Gly Gly Asn Leu Glu Ala 
50 .55 ^0 



Thr Phe Thr Phe Met Arg Glu Asp Arg Cys lie Gin Lys Lys He Leu 
65 



70 75 80 



Met Arg Lys Thr Glu Glu Pro Gly Lys Phe Ser Ala Tyr Gly Gly Arg 
85 90 95 

Lys Leu He Tyr Leu Gin Glu Leu Pro Gly Thr Asp Asp Tyr Val Phe 
100 105 110 

Tyr cys Lys Asp Gin Arg Arg Gly Gly Leu Arg Tyr Met Gly Lys Leu 
115 120 125 

Val Gly Pro Cys Arg Cys Pro His Val Gly Ser Pro Gly His Leu Thr 
130 135 140 

Cys Arg 
145 



<210> 5 
<211> 741 
<212> ADN 

<213> Homo sapiens 

<220> 

<221> CDS 

<222> (43).. (726) 

<223> CDNA396 (741) /SM4 (hOBPI la-gamma) 



cgcccagtga cctgccgagg tcggcagcac agagctctgg ag atg aag acc ctg 54 

1 
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ttc ctg ggt gtc acg etc ggc ctg gcc get gcc ctg tec ttc ace ctg 102 
Phe Leu Gly Val Thr Leu Gly Leu Ala Ala Ala Leu Ser Phe Thr Leu 



5 



10 15 20 



qag gag gag gat ate aca ggg ace tgg tac gtg aag gcc atg gtg gtc 150 
Glu Glu Glu Asp He Thr Gly Thr Trp Tyr Val Lys Ala Met Val Val 
25 30 35 

gat aag gae ttt ceg gag gac agg agg cce agg aag gtg tee eea gtg 198 
Asp Lvs Asp Phe Pro Glu Asp Arg Arg Pro Arg Lys Val Ser Pro Val 
40 45 50 

aag gtg aca gcc ctg ggc ggt ggg aac ttg gaa gee acg ttc ace ttc 246 
Lys Val Thr Ala Leu Gly Gly Gly Asn Leu Glu Ala Thr Phe Thr Phe 
55 60 65 

atg agg gag gat egg tge ate cag aag aaa ate ctg atg egg aag acg 294 
Met Arg Glu Asp Arg Cys He Gin Lys Lys He Leu Met Arg Lys Thr 
70 75 80 

gag gag cet ggc aaa ttc age gee tat ggg ggc agg aag etc ata tac 342 
Glu Glu Pro Gly Lys Phe Ser Ala Tyr Gly Gly Arg Lys Leu He Tyr 



85 



90 95 100 



ctg cag gag ctg cec ggg acg gac. gac tac gte ttt tac tge aaa gac 390 
Leu Gin Glu Leu Pro Gly Thr Asp Asp Tyr Val Phe Tyr Cys Lys Asp 
105 110 115 

cag cge cgt ggg ggc ctg cge tac atg gga aag ett gtg gca tct get 438 
Gin Arg Arg Gly Gly Leu Arg Tyr Met Gly Lys Leu Val PJ.a Ser Ala 
120 125 130 

cec tge agg gcc gtg ccg ctg tec cca cgt egg etc ace tgg cea cet 486 
Pro cys Arg Ala Val Pro Leu Ser Pro Arg Arg Leu Thr Trp Pro Pro 
135 140 145 

cac ctg cag gta gga ate eta ata cca acc tgg agg cec tgg aag aat 534 
His Leu Gin Val Gly He Leu He Pro Thr Trp Arg Pro Trp Lys Asn 
150 155 160 

tta aga aat tgg tge age aca agg gae tct egg agg agg aca ttt tea 582 
Leu Arg Asn Trp Cys Ser Thr Arg Asp Ser Arg Arg Arg Thr Phe Ser 
165 170 175 180 

tge cce tge aga egg gaa get geg ttc teg aac act agg cag cec ccg 630 
CVS Pro cys Arg Arg Glu Ala Ala Phe Ser Asn Thr Arg Gin Pro Pro 
' 185 190 195 

ggt ctg cac etc cag age cca cce tac cac cag aca cag age ccg gac 678 
Glv Leu His Leu Gin Ser Pro Pro Tyr His Gin Thr Gin Ser Pro Asp 
200 205 210 

cac ctg gac eta cec tec age cat gae cet tec ctg etc cca cec ace 726 
His Leu Asp Leu Pro Ser Ser His Asp Pro Ser Leu Leu Pro Pro Thr 
215 220 225 

741 

tgactccaaa taaag 
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<210> 6 
<211> 228 
<212> PRT 

<213> Homo sapiens 

Met°Lys Thr Leu Phe Leu Gly Val Thr Leu Gly Leu Ala Ala Ala Leu 
1 5 10 15 

Ser Phe Thr Leu Glu Glu Glu Asp lie Thr Gly Thr Trp Tyr Val Lys 
20 25 30 

Ala Met Val Val Asp Lys Asp Phe Pro Glu Asp Arg Arg Pro Arg Lys 
35 40 45 

Val Ser Pro Val Lys Val Thr Ala Leu Gly Gly Gly Asn Leu Glu Ala 
50 55 60 

Thr Phe Thr Phe Met Arg Glu Asp Arg Cys lie Gin Lys Lys He Leu 
65 70 75 80 

Met Arg Lys Thr Glu Glu Pro Gly Lys Phe Ser Ala Tyr Gly Gly Arg 
85 90 95 

Lvs Leu He Tyr Leu Gin Glu Leu Pro Gly Thr Asp Asp Tyr Val Phe 
100 105 110 

Tyr cys Lys Asp Gin Arg Arg Gly Gly Leu Arg Tyr Met Gly Lys Leu 
115 120 125 

Val Ala Ser Ala Pro Cys Arg Ala Val Pro Leu Ser Pro Arg Arg Leu 
130 135 140 

Thr Trp Pro Pro His Leu Gin Val Gly He Leu He Pro Thr Trp Arg 
145 150 155 160 

Pro Trp Lys Asn Leu Arg Asn Trp Cys Ser Thr Arg Asp Ser Arg Arg 
165 170 175 

Ara Thr Phe Ser Cys Pro Cys Arg Arg Glu Ala Ala Phe Ser Asn Thr 
^ 180 185 190 

Arg Gin Pro Pro Gly Leu His Leu Gin Ser Pro Pro Tyr His Gin Thr 
195 200 205 

Gin ser Pro Asp His Leu Asp Leu Pro Ser Ser His Asp Pro Ser Leu 
210 215 220 

Leu Pro Pro Thr 
225 



<210> 7 
<211> 607 
<212> ADN 

<213> Homo sapiens 
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<220> 

<221> CDS 

<222> (43) . . (483) 

<223> CDNA396 (607) - forme courte (hOBPIIa-delta) 

<400> 7 _ . 

cacccagtga cctgccgagg tcggcagcac agagctctgg ag atg aag acc ctg 54 
^ Met Lys Thr Leu 

1 



ttc ctg ggt gtc acg etc ggc ctg gcc get gcc ctg tec ttc acc ctg 
Phe Leu Gly Val Thr Leu Gly Leu Ala Ala Ala Leu Ser Phe Thr Leu 
5 10 15 20 



gcg gaa gac gga gga gcc tgg caa att cag cgc eta tgg ggg cag gaa 
Ala Glu Asp Gly Gly Ala Trp Gin lie Gin Arg Leu Trp Gly Gin Glu 
40 45 50 

get cat ata cct gca gga get gcc egg gac gga ega eta cgt ett tta 
Ala His He Pro Ala Gly Ala Ala Arg Asp Gly Arg Leu Arg Leu Leu 
55 60 65 



85 



90 95 100 



102 



gag gag gag gat gag gga gaa teg gtg cat cca gaa gaa aat cct gat 150 
Glu Glu Glu Asp Glu Gly Glu Ser Val His Pro Glu Glu Asn Pro Asp 
25 30 35 



198 



246 



ctg caa aga cca gcg ccg tgg ggg cct gcg eta cat ggg aaa get tgt 294 
Leu Gin Arg Pro Ala Pro Trp Gly Pro Ala Leu His Gly Lys Ala Cys 
70 75 80 

ggc ate tgc tec ctg cag ggc cgt gcc get gtc ccc acc ttg get cae 
Gly He Cys Ser Leu Gin Gly Arg Ala Ala Val Pro Thr Leu Ala His 



342 



390 



ctg gcc acc tea cct gca ggt agg aat cct aat ace aac ctg gag gee 
Leu Ala Thr Ser Pro Ala Gly Arg Asn Pro Asn Thr Asn Leu Glu Ala 
105 110 115 

ctg gaa gaa ttt aag aaa ttg gtg cag cgc aag gga etc teg gag gag 
Leu Glu Glu Phe Lys Lys Leu Val Gin Arg Lys Gly Leu Ser Glu Glu 
120 125 130 

gac att ttc atg ccc ctg cag acg gga age tgc gtt etc gaa cac 
Asp He Phe Met Pro Leu Gin Thr Gly Ser Cys Val Leu Glu His 
135 140 145 

taggcagece ccgggtctge acctccagag eccacectae caecagaeae agagceegga 54 3 
ceacctggae etacectcca gccatgaecc ttccctgetc ccacceacet gactecaaat 603 
aaag 



438 



483 



607 



<210> 8 
<211> 147 
<212> PRT 

<213> Homo sapiens 
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<400> 8 

Met Lys Thr Leu Phe Leu Gly Val Thr Leu Gly Leu Ala Ala Ala Leu 
15 10 15 

Ser Phe Thr Leu Glu Glu Glu Asp Glu Gly Glu Ser Val His Pro Glu 
20 25 30 

Glu Asn Pro Asp Ala Glu Asp Gly Gly Ala Trp Gin lie Gin Arg Leu 
35 40 45 

Trp Gly Gin Glu Ala His lie Pro Ala Gly Ala Ala Arg Asp Gly Arg 
50 55 60 

Leu Arg Leu Leu Leu Gin Arg Pro Ala Pro Trp Gly Pro Ala Leu His 
65 70 75 80 

Gly Lys Ala Cys Gly lie Cys Ser Leu Gin Gly Arg Ala Ala Val Pro 
85 90 95 

Thr Leu Ala His Leu Ala Thr Ser Pro Ala Gly Arg Asn Pro Asn Thr 
100 105 110 

Asn Leu Glu Ala Leu Glu Glu Phe Lys Lys Leu Val Gin Arg Lys Gly 
115 120 125 

Leu Ser Glu Glu Asp He Phe Met Pro Leu Gin Thr Gly Ser Cys Val 
130 135 140 

Leu Glu His 
145 



<210> 9 
<211> 676 
<212> MN 

<213> Homo sapiens 

<220> 

<221> CDS 

<222> (43) . . (552) 

<223> CDNA2098 (676) - forme classique (hOBPI lb- alpha) 
<400> 9 

cgcccagtga cctgccgagg tcggcagcac agagctctgg ag atg aag acc ctg 54 

Met Lys Thr Leu 
1 

ttc ctg ggt gtc acg etc ggc ctg gcc get gcc ctg tec ttc acc ctg 102 
Phe Leu Gly Val Thr Leu Gly Leu Ala Ala Ala Leu Ser Phe Thr Leu 
5 10 15 20 

gag gag gag gat ate aca ggg acc tgg tac gtg aag gcc atg gtg gtc 150 
Glu Glu Glu Asp He Thr Gly Thr Trp Tyr Val Lys Ala Met Val Val 
25 30 35 



gat aag gac ttt ccg gag gac agg agg ccc agg aag gtg tec cca gtg 
Asp Lys Asp Phe Pro Glu Asp Arg Arg Pro Arg Lys Val Ser Pro Val 
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45 50 



aag gtg aca gcc ctg ggc ggt ggg aag ttg gaa gcc acg ttc acc ttc 246 
Lys Val Thr Ala Leu Gly Gly Gly Lys Leu Glu Ala Thr Phe Thr Phe 
55 60 65 

atg agg gag gat egg tgc ate cag aag aaa ate etg atg egg aag acg 294 
Met Arg Glu Asp Arg Cys He Gin Lys Lys He Leu Met Arg Lys Thr 
70 75 80 

gag gag cct ggc aaa tac age gcc tat ggg ggc agg aag etc atg tac 342 
Glu Glu Pro Gly Lys Tyr Ser Ala Tyr Gly Gly Arg Lys Leu Met Tyr 
85 90 95 

ctg eag gag ctg ccc agg agg gac cac tac ate ttt tac tgc aaa gac 390 
Leu Gin Glu Leu Pro Arg Arg Asp His Tyr He Phe Tyr Cys Lys Asp 
105 110 115 

cag cac cat ggg ggc ctg etc cac atg gga aag ctt gtg ggt agg aat 438 
Gin His His Gly Gly Leu Leu His Met Gly Lys Leu Val Gly Arg Asn 
120 125 130 

tct gat acc aac egg gag gee etg gaa gaa ttt aag aaa ttg gtg cag 486 
Ser Asp Thr Asn Arg Glu Ala Leu Glu Glu Phe Lys Lys Leu Val Gin 
135 140 145 

cge aag gga etc teg gag gag gac" att ttc acg ccc etg cag acg gga 534 
Arg Lys Gly Leu Ser Glu Glu Asp He Phe Thr Pro Leu Gin Thr Gly 
150 155 160 

age tgc gtt ccc gaa cac taggcagccc ccgggtctgc aectccagag 582 
Ser Cys Val Pro Glu His 
165 170 

cccaccctac caccagacac agagcccgga ccacctggac ctaccctcca gccatgaccc 642 
ttccctgctc ccacccacct gactccaaat aaag 



<210> 10 

<211> 170 

<212> PRT 

<213> Homo sapiens 

<400> 10 

Met Lys Thr Leu Phe Leu Gly Val Thr Leu Gly Leu Ala Ala Ala Leu 
15 10 15 

Ser Phe Thr Leu Glu Glu Glu Asp He Thr Gly Thr Trp Tyr Val Lys 
20 25 30 

Ala Met Val Val Asp Lys Asp Phe Pro Glu Asp Arg Arg Pro Arg Lys 
35 40 45 

Val ser Pro Val Lys Val Thr Ala Leu Gly Gly Gly Lys Leu Glu Ala 
50 55 60 

Thr Phe Thr Phe Met Arg Glu Asp Arg Cys He Gin Lys Lys He Leu 
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65 70 



75 80 



Met Arg Lys Thr Glu Glu Pro Gly Lys Tyr Ser Ala Tyr Gly Gly Arg 
85 90 95 

Lvs Leu Met Tyr Leu Gin Glu Leu Pro Arg Arg Asp His Tyr He Phe 
100 105 110 

Tyr cys Lys Asp Gin His His Gly Gly Leu Leu His Met Gly Lys Leu 
115 120 125 

Val Gly Arg Asn Ser Asp Thr Asn Arg Glu Ala Leu Glu Glu Phe Lys 
130 135 140 

Lys Leu Val Gin Arg Lys Gly Leu Ser Glu Glu Asp He Phe Thr Pro 
145 150 155 160 

Leu Gin Thr Gly Ser Cys Val Pro Glu His 
165 170 



<210> 11 
<211> 782 
<212> ADN 

<213> Homo sapiens 

<220> 

<22\> CDS 

<222> (1) - . (537) 

<223> CDNA2098 (782) - forme longue (hOBPIIb-beta) 
<400> 11 

cgc cca gtg acc tgc cga ggt egg cag cac aga get etg gag atg aag 
Ara Pro Val Thr Cys Arg Gly Arg Gin His Arg Ala Leu Glu Met Lys 
£5 10 15 

acc etg ttc etg ggt gtc acg etc ggc etg gee get gee etg tee ttc 
Thr Leu Phe Leu Gly Val Thr Leu Gly Leu Ala Ala Ala Leu Ser Phe 
20 25 30 

ace etg gag gag gag gat ate aea ggg acc tgg tac gtg aag gee atg 
Thr Leu Glu Glu Glu Asp He Thr Gly Thr Trp Tyr Val Lys Ala Met 
35 40 45 

gtg gtc gat aag gac ttt ccg gag gae agg agg ccc agg aag gtg tec 
Val Val Asp Lys Asp Phe Pro Glu Asp Arg Arg Pro Arg Lys Val Ser 
50 55 60 

cca gtg aag gtg aea gee etg ggc ggt ggg aag ttg gaa gee acg ttc 
Pro Val Lys Val Thr Ala Leu Gly Gly Gly Lys Leu Glu Ala Thr Phe 
65 70 75 80 

acc ttc atg agg gag gat egg tgc ate cag aag aaa ate etg atg egg 
Thr Phe Met Arg Glu Asp Arg Cys He Gin Lys Lys He Leu Met Arg 
85 90 95 

aag acg gag gag ect ggc aaa tac age gee tgc ttg tec gea gtc gag 
Lys Thr Glu Glu Pro Gly Lys Tyr Ser Ala Cys Leu Ser Ala Val Glu 



48 



96 



144 



192 



240 



288 



336 
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100 105 110 

atg gac cag ate acg cct gcc etc tgg gag gcc eta gee att gac aca 384 
Met Asp Gin lie Thr Pro Ala Leu Trp Glu Ala Leu Ala lie Asp Thr 
115 120 125 

ttg agg aag ctg agg att ggg aca agg agg cca agg att aga tgg ggg 432 
Leu Arg Lys Leu Arg lie Gly Thr Arg Arg Pro Arg lie Arg Trp Gly 
130 135 140 

cag gaa get cat gta cct gca gga get gcc cag gag gga cca eta cat 480 
Gin Glu Ala His Val Pro Ala Gly Ala Ala Gin Glu Gly Pro Leu His 
145 150 155 160 

ctt tta ctg caa aga cca gca cca tgg ggg cct get cca cat ggg aaa 528 
Leu Leu Leu Gin Arg Pro Ala Pro Trp Gly Pro Ala Pro His Gly Lys 
165 170 175 

get tgt ggg taggaattet gataecaacc gggaggcect ggaagaattt: 577 
Ala Cys Gly 

aagaaattgg tgcagegcaa gggactctcg gaggaggaca ttttcacgcc cetgeagacg 637 
ggaagctgeg tteccgaaea ctaggcagee cccgggtctg cacctccaga gcecacceta 697 
ccaccagaca cagagcecgg accacctgga cctaccctcc agccatgacc cttccctgct 757 
cccacccacc tgactccaaa taaag 782 



<210> 12 
<211> 179 
<212> PRT 

<213> Homo sapiens 
<400> 12 

Arg Pro Val Thr Cys Arg Gly Arg Gin His Arg Ala Leu Glu Met Lys 
15 10 15 

Thr Leu Phe Leu Gly Val Thr Leu Gly Leu Ala Ala Ala Leu Ser Phe 
20 25 30 

Thr Leu Glu Glu Glu Asp lie Thr Gly Thr Trp Tyr Val Lys Ala Met 
35 40 45 

Val Val Asp Lys Asp Phe Pro Glu Asp Arg Arg Pro Arg Lys Val Ser 
50 55 60 

Pro Val Lys Val Thr 7U.a Leu Gly Gly Gly Lys Leu Glu Ala Thr Phe 
65 70 75 80 

Thr Phe Met Arg Glu Asp Arg Cys lie Gin Lys Lys lie Leu Met Arg 
85 90 95 

Lys Thr Glu Glu Pro Gly Lys Tyr Ser Ala Cys Leu Ser Ala Val Glu 
100 105 110 



Met Asp Gin lie Thr Pro Ala Leu Trp Glu Ala Leu Ala lie Asp Thr 
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115 120 125 

Leu Arg Lys Leu Arg lie Gly Thr Arg Arg Pro Arg lie Arg Trp Gly 
130 135 140 

Gin Glu Ala His Val Pro Ala Gly Ala Ala Gin Glu Gly Pro Leu His 
145 150 155 160 

Leu Leu Leu Gin Arg Pro Ala Pro Trp Gly Pro Ala Pro His Gly Lys 
165 170 175 

Ala Cys Gly 



<210> 13 
<211> 542 
<212> ADN 

<213> Homo sapiens 

<220> 

<221> CDS 

<222> (43).. (297) 

<223> CDNA2098 (542) - forme courte (hOBPIIb-garoma) 

<400> 13 4. 
cqcccagtga cctgccgagg tcggcagcac agagctctgg ag atg aag acc ctg 54 
^ Met Lys Thr liCU 

1 

ttc ctg ggt gtc acg etc ggc ctg gcc get gee ctg tec tte acc ctg 102 
Phe Leu Gly Val Thr Leu Gly Leu Ala Ala Ala Leu Ser Phe Thr Leu 
5 10 15 20 

gag gag gag gat gag gga gga teg gtg cat cea gaa gaa aat cet gat 
Glu Glu Glu Asp Glu Gly Gly Ser Val His Pro Glu Glu Asn Pro Asp 
25 30 35 

gcg gaa gae gga gga gcc tgg eaa att cag ege eta tgg ggg eag gaa 
Ala Glu Asp Gly Gly Ala Trp Gin He Gin Arg Leu Trp Gly Gin Glu 
40 45 50 

act cat ata cet gca gga get gcc eag gag gga eca eta cat ett tta 
Ala His He Pro Ala Gly Ala Ala Gin Glu Gly Pro Leu His Leu Leu 
55 60 65 

ctg eaa aga cea gea eca tgg ggg cet get eca cat ggg aaa get tgt 294 
Leu Gin TVrg Pro Ala Pro Trp Gly Pro Ala Pro His Gly Lys Ala Cys 
70 75 80 

ggg taggaattet gataeeaacc gggaggcect ggaagaattt aagaaattgg 347 

Gly 
85 

tgeagegeaa gggactcteg gaggaggaca tttteaegee ectgcagaeg ggaagctgcg 407 
ttcccgaaca ctaggeagec ceegggtctg eacetceaga geeeaeccta ceaceagaca 467 



150 



198 



246 
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cagagcccgg accacctgga cctaccctcc agccatgacc cttccctgct cccacccacc 527 
tgactccaaa taaag 542 



<210> 14 
<211> 85 
<212> PRT 

<213> Homo sapiens 
<400> 14 

Met Lys Thr Leu Phe Leu Gly Val Thr Leu Gly Leu Ala Ala Ala Leu 
15 10 15 

Ser Phe Thr Leu Glu Glu Glu Asp Glu Gly Gly Ser Val His Pro Glu 
20 25 30 

Glu Asn Pro Asp Ala Glu Asp Gly Gly Ala Trp Gin lie Gin Arg Leu 
35 40 45 

Trp Gly Gin Glu Ala His lie Pro Ala Gly Ala Ala Gin Glu Gly Pro 
50 55 60 

Leu His Leu Leu Leu Gin Arg Pro Ala Pro Trp Gly Pro Ala Pro His 
65 70 75 80 

Gly Lys Ala Cys Gly 
85 



<210> 15 

<211> 10664 

<212> ADN 

<213> Homo sapiens 

<220> 

<223> Gene hOBPIIa 
<400> 15 

ctctgcttct atattcggcc tccaaatctg tgctcaatgc agcaactgga gtgacccctt 60 
aaatacgtaa gtcacagctt gcctttgtca gagctatcca gggtctttca ctcagagcag 120 
aagctgaagt cctcgtggtg gtccttaatc cctacatggc cgttccaccc actccccagc 180 
ctcatgtgtg gccggtctcc ctggatcatt tgctgtggct gctctgccgt gtgttcccgg 240 
aaactgccag cgttctccca cctctgggct ggcactggat gctcctgcca cctggactcc 300 
tcttccagct gacgagctca tggcttgctt ccttcatgtc ttaaattcgg tgtttgaatg 360 
ccaccttggc gaggctgttc ctcatcaatt catgtaaagg acaaataacc ccttgtctgg 420 
ccactcctgt ccaacttgtc cactttgctt tttccatagc actgatcacc atttaaaata 480 
atgtatgaac cagtgaccca tcagtgacca gagacagtag attgaacagg tattgcttgc 540 
acagtgaaca atcagctcta gaggtttaaa gagaaccaca aagaatggct caggattgca 600 
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cgagggcagt taaggaagaa ataaacaggg gtggggatcc tttccacaag tgtgggttca 660 
gaccgcatgg gagaaggtgt ggttctccca agggaagctg gagaagtttg ctgggttgtc 720 
ccagccacag ctggcccacg gtcagggcag aggccagcag gcagggaaat gtaggctggg 780 
tctggcaagc aggaagcctc tcttcccccg caaggcaggt gggctggggc tgggaagcct 840 
acaagagtca ctgggaaccc acaggtgcag atgccactga atctcaatag gaagccatct 900 
gggggggtcc cctgaattca atgtggtgtg tgccgccaga cgtccccaac ttgtgccact 960 
gccatttata caggaagaga aagaaaaagg aagaaatgga agcatctgga accagtcatc 1020 
ctggacccat gctaggaggt gcttccccct acgcctcaac caacaaagct tagcattgca 1080 
ccaggtgcac aagagaagcg cctgctggct ccagctccat tgcctcggaa ccagccatga 1140 
agggtgcgtg tggagctgga ggcaagacat tgatagctgg cactgcaatt cacttattta 1200 
ttttgttcat tttaagtccc ctgcacctag aatataagcc ccccaagcac aggacatttg 1260 
ttttattgat cgatgtattc cttgtgcccc aaagaatgag aggcatctag aaagtctgca 1320 
aaaatcaaac ataaaaatga acctttattc agtcattgtt attttgatgg atatttgagg 1380 
.<;atttccaag atttgtaagt aacaattgaa cccttctcct ggttcatgtg tgggagtgta 1440 
tctgttcaaa tgatgcttct gagtggagtt gctgagtctt tggctctagg tttttttttt 1500 
ttaagcattt atgctcattg tggtttttaa attaaacatt taaccctgag acactgtaga 1560 
ttcccatgca attgtaaaaa gccacacaga gctatcatgt gtatcttcac ctggcttgct 1620 
ccagccccaa ccccagcaat gacagacctg ttctccactc ctgcaatctg ctcattgcaa 1680 
gaatgtcgtc tattgcaatc ataaaattgt gggattggct ttttttttcc tgtgcagcat 1740 
cattctctgg agattcatcc tattgttgca tttatcaata gtttattcca ttttacttct 1800 
gagtagtgct ctatggtatg gatgtaccac agtctgttta accattcacc tgttggagga 1860 
agtctgtgtt tatagatttg ggctatgaca catgtatagg tttttgcatg gacatcagtt 1920 
ttcatttccc tgggacaaag gcccaggggt tctattgctg gattctatgc ttgttacagg 1980 
gctcattttg ttttgttttg ctttgtttta ttttgttttt aacctgtcaa gccattttcc 2040 
agatccagtt tccatgcatc ctcaccaggc ttcagtatga tcactatgat cttatctcag 2100 
ccaccttaat aggtatgtac tgatatatca tggcttttat ttgcatttca ctgatgacta 2160 
atggtgttga gcatcttttc atgtgtttat ttgccatctg tatatcctct ctagtcaagt 2220 
gtcccttcat gtcttttgtt tacgttctat ttttgaaact gttgagtttt gaaaaattct 2280 
ttataaagta tagaaactaa ttctttgttg aatatgtagt ttgtcaatat tttctttcag 2340 
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tctttggctt gtctttttat tctgttaaca gggtctctta cagagcaaaa ggtttttatt 2400 
ttgatgaagt ctattttaac aatttttcct tttatggatc atatttttgg caacaaatct 24 60 
aaaacctcct gacccagctc catatgtcaa agattttctt gttttctaaa agttttatag 2520 
ttttaagttt tatgttgaag tctatgatcc attttgagtt aattttcata cagggtgtga 2580 
gaccaaggtt gtggttcttc tttttctttg gtggttttgt ctgtggatgt ccagttgctc 2640 
cagcccattt gctacaaaag ctatctttcc tccactgaat tacttttgca tctttgtaaa 2700 
aatgtaattg ggtgtatttg tacaggtctg tttgaggatt ctttattgtc tgtcccattg 2760 
atctatgcat ctgtccatgt gctagctata taagtcttga aagggtagcc tgtagctggg 2820 
tgtggtggcg agagcctgta atcccagcta ttcgggaagt ggaggcagga gaatcgattg 2880 
aacccaggag gtggaggttg cagtgagtca agatcgtgcc actgcactcc agcctgggtg 2940 
acagagtgaa ctccatataa aaaaataaaa acaaaaataa agtagcgtga tttctcccac 3000 
cttattcttt tttaaaaaag ttttagctat tccagttcct ttgcctttcc atataaattt 3060 
tagaataatc ttgtctatat ctaccacaat tctttctgga attttgatag aaattttgtt 3120 
acatctttat attatttgag agaaatgata tttttactat gttgagtctt ctaatccatg 3180 
gatataacgt ctctccattt gtttagatct tctttgattt attttataat cattgcattg 3240 
ttttcagcat acaaatccag catatgggtt gttagactta tgcctaggca tctcattttt 3300 
ttagccatta taaatagtac tgtgttttta agtttagggt ccattactag tatgtagaca 3360 
cacaattgat ctttgtatat ttatcttgtg tcctgcaacc ttgctgaact cacttactag 3420 
ttctaggagg tgtattgttt tcttttgttt tgtttttcaa tttcttggga ttttctacag 3480 
agataataat gtcatctgca gatgcagttt tcttccttcc tttccaattt gtatgtcttt 3540 
aatttccttt ttaaaaaacc tatattactc tgactagaac tttctgtact atgttaaata 3600 
caagtggtag agtggacatc cttgccttgt ccctgatgtt aaagagaaag catttgtaac 3660 
tgagtatccc agcctcaaaa tgtgcttaaa aacttttttc ctttcttgct ttcagccttg 3720 
aaacatactt cgaaactctt tatttctccc tttcccacca ggcacttccg tgagcagtgc 3780 
tcgcttatct aattatgtgc ttacttagaa attccagggg ccaattttga aacaaaccag 3840 
gcagagagac ccagctgcag aatcctccct cttaggggga gttacaggta gcctaccact 3900 
tcccggctga aatcaggatg acgcaaacca gacctccgga cagacgattg atgactcaca 3960 
ataaccatca gaacaagatg cagaccaaca tcctcctgca ccattcccac atatttccca 4020 
caccttttcc tccttaaacc ccttcgctca gtccagaaaa tctgaatggt cttttaaagg 4080 
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catgggtctg gccattcccc aactgccagt atttgaataa agctgctttc cttttaccac 4140 
acctcacttc tcatgccttg acttctgagc agcgagcagc tggacttgag ccagttacac 4200 
atcagtcttt caccattaga aataatgtag ccataggttt ttttttcgta gatgttcttt 4260 
ttcaagttaa agaagttctc ttctattcct atttttctga gaggtgttat cccgaatgag 4320 
tgttgaattt tgttaaatac ttttaacaac ccaacaggaa ccaccatcag aagccatcca 4380 
gagaaacgca ccaggccaca aagcactggg ggccagggat cttgcccctg ctgtctgcca 4440 
tgggttgacc cccagcctcc aaccctacca tcccctgacg gtgtctgcag cagttgaacc 4500 
caaccagcat ctaaaagaac acagttggtg aacgagactg ggacacaggg caagatgggt 4560 
ggacaatggg aggctcctgg agagcacccg taccagcgag catagaattc atgggggtga 4620 
cctgttccct gaagcatctg cgcgtgttgt tccagcattt tcttcaagga ttgagccagc 4680 
agcaccagtg tcatacggtg cttaaatcaa tgattcacag ccaaccaatg aaatacaagg 4740 
tgccggctgg gcgcggtggc tcacgcctgt aatcccagca ctttgggagg ccgaggcggg 4800 
cggatcacga ggtcaggaga tcgagaccat cccggctaaa acggtgaaac cccgtctcta 4860 
ctaaaaatac aaaaaaaatt agccgggcgt agtggcgggc gcctgtagtc ccagctactt 4920 
gggaggctga ggcaggagaa tggcgtgaac ccgggaggcg gagcttgcag tgagccaaga 4980 
tcccgccact gcactccagc ctgggcgaca gagcgagact ccgtctcaaa aaaaaaaaaa 5040 
aaaaaaaaaa aaaagaaata caaggtgcct ggggtacagg caacaaaaat ggggaacgga 5100 
gaaatcttcc cgttgaggta gagactccag cctgtttgct catctctggt cctgaagagc 5160 
ccagtccccg ccctaaggat ggggtttctg ctcggcagca cttgccgtga gaggggtgag 5220 
gcactgggtc acgccagccc tttctttata gcccccaggg tttattagag tgtgcattag 5280 
tattatttag caagcacttg agggtgtctg atcttgggcc agagaggcac aaagattgtg 5340 
tgggcccagc acctgcctgc agagcgtggg tcagccttgg gtcccagggc agatgacgca 5400 
ggcccgggaa ctacagggtc caggagggag aaggcaaagt tctggctcag gttggctggg 5460 
gatgaggcca gcggagccag gtgcccaagg gagctcagcc acaaactctg agcacaggct 5520 
ggcaggtggc tcttgatgct catgccaccc atttatctaa agggatgaga ttcaaggcct 5580 
gtcctggtgg ctgggggccg tcgaagctga cgagagaggg gatgtagagt gaatgtatat 5640 
tccactctac cacttgtatt taacagggag atggatgatg aacacgtgca ggaggaaaca 5700 
ggcaggacaa tccagagaga tcacgtgttc tgaggacagc acagccaggc tccggtacgg 5760 
agtgaagcgg ggtggggcag gcggcggggt ccctcatatg gcccgaggag gccgtatata 5820 
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tactgacctt gagccacaca atagtgccct tctctgcccc taggaagctc gagtgcaggg 5880 
tccaggtggg gaaaatcaat gcagagtggg tcccagagtg ggcggaagct tgggctctag 5940 
ggcgtgcggg actcagctgg cagcagcccc acatctctat ggttctaaag cccagtccat 6000 
ttctgctcag cagggagatg gccagttccc cagaggactt gcccagggtc ccagccgtgg 6060 
ccctgggagg gctcaggggt gagggaggga gaattccgag ccgtgggccc tccctctgtg 6120 
gctcggggtg cagacgtgca ctaccctgcc ctgtcctctg gagtcctccg ggctcatcca 6180 
agtgggcgca tttgggtgca aaccctggac agcatcgtgt gtcttttctt ctctggctgg 6240 
cactgaattg ctgttcacca gatgccagca atgaggacac tccccctccc ggatgcagga 6300 
ctggttgcca ccatggggag gggtgcaccg tgccacgtgc tcccaggaca ctggccaggg 6360 
ggctataaag aacatctcga gaggagccag cacagccttg ttcagacgcc cagtgacctg 6420 
ccgaggtcgg cagcacagag ctctggagat gaagaccctg ttcctgggtg tcacgctcgg 6480 
cctggccgct gccctgtcct tcaccctgga ggaggaggat gtgagctggg ttggcgtggg 6540 
cggatggagg agccaggtgg actcctgggc agggggcagt gccaggggcc ctgctttagg 6600 
aggtgtcact taagcctggg gtggtggtgg aggggtccta ttgttccttc agcagacaat 6660 
gctccccatg aggcccaggg ccggagcagg ctcggctcag gggttcctgc tgcactgacg 6720 
cctgaagccc gaaggtctcg cagggttggg ccctgtggag ggagggctca cctggtgctg 6780 
gggcccgggg gtccatgggg tgcagacatg ccctccttcc actgggggct gggagccctg 6840 
agcagggggc tggctctaac tcactccagc tgagctctaa ctaaggtgca ggaacccagc 6900 
ctgcctttag gggtggcagc cgggcaccat gggtgtctgg ttatagctgc aggcctgagt 6960 
gccagggtca gagtagaatc tgggccaccc atggtgggct cacggccttg gcctgctcca 7020 
gatcacaggg acctggtacg tgaaggccat ggtggtcgat aaggactttc cggaggacag 7080 
gaggcccagg aaggtgtccc cagtgaaggt gacagccctg ggcggtggga acttggaagc 7140 
cacgttcacc ttcatgtgag tgttgcccac tgcagggccc ctcaggccac tttcgctccc 7200 
cgccccagac ccacctggtg cccattgccc catccacatt tcgggtgttg ggaagagtca 7260 
ccccctgcct tggagggaaa cagccagggc atcctgaagc tcggtggggt gggggggcag 7320 
tggaattttc aggttgccgg gtcagggcca tgcaccaggt gagctgagga tgggccaggt 7380 
gtgtcctggg agccgctgcc cgcgtgtctc ctgttttcca ggagggagga tcggtgcatc 7440 
cagaagaaaa tcctgatgcg gaagacggag gagcctggca aatacagcgc ctgtgagccc 7500 
ctccccgacc ccccactccc catgcccaac cccggatgca ccagccccac tgcaggtgga 7560 
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gagtgcccag gccacacttc tgccagggtc ccagccctgc ccacctccaa ggaggggctg 7620 
gcctctcctt cctggggggc tggtggccct gacatcagac accaggtgtg acaggcttgt 7680 
ccacagtaga gatggaccag atcaagcctg ccctctggga ggccctagcc attgacacat 7740 
tgaggaatcc gagtgttagg gaccaggagg ccgagggtta gggatgggaa gccaaggctg 7800 
agggtttggg atcaggaatc cgagggttag ggacagggaa gtggggcagg agcagctgct 7860 
ggagctggga aggccggact ctagtcctgg acgtgctctg gccttgtggc tccattactt 7920 
gcattgggac cttccgagag gaggctcctg cctccgtgtc cgggtccatg ctgtgcggag 7980 
cagccaggcc tggctcaggc tgtccagggc acctgggtga ccactgaaac attcctgagt 8040 
gtttcttcgt gtggtcctga gtgctctctc cgggaatgag ggcactgaag acccatcttc 8100 
tctgtcatct acagatgggg gcaggaagct catatacctg caggagctgc ccgggacgga 8160 
cgactacgtc ttttactgca aagaccagcg ccgtgggggc ctgcgctaca tgggaaagct 8220 
tgtgggtgag gggcccgctg gggcctgcat gtcctgcccc atggtctctg cctccagaag 8280 
ccagtggaac caccatcatc acgccctggc acggggggaa aaggaagccc cctgcgccgg 8340 
ccttcgtgtg ctaggcacca agcgctgccc tggatggctg gtccaagttc ctgaagtggg 8400 
agtggggtgg gccaggcagg gacagacacg gccctcggtg acgtgaacct gccaagggcc 8460 
gcttgtgggg tctcaggtgt aggggcctca ccttaagggg gaggtancat cttaacagag 8520 
ctcttcatgg ggcagggact ctccagggcg gcagggcagc cagtgcctct gggacacaag 8580 
gtccctccag gtgagggttg tgaccctgca gagtggcttt gggagctgcc caggtccccc 8640 
tggggttgct gagtggcttg gaccctgcca ctgtcccctt tcctggggac ctctcacctg 8700 
ggcggtggcc gtctcctctg tccccagtcc cacccctgag ctcttgtcca ttctcaggcc 8760 
tcctctcccc cttgcctggt gctggacagt tgccatctct tctgtcccca gccccacccc 8820 
tgagctctga tccactctcg ggcctctccc ccgtcctgat gctgggccgt ggtcgtctcc 8880 
ttttagcatc tgctccctgc agggccgtgc cgctgtcccc acgtcggctc acctggccac 8940 
ctcacctgca ggtaggaatc ctaataccaa cctggaggcc ctggaagaat ttaagaaatt 9000 
ggtgcagcac aagggactct cggaggagga cattttcacg cccctgcaga cgggtgagga 9060 
cggctgtgcc cagtaccccg tgttcccctg tgtctctgtg tgatctccag tgtcccatga 9120 
ccctcgtgtc ctcccatgtc ccccgcattc cccatgtgcc ccgagtctcc tcgcaggggc 9180 
tctgggccct gcttagcatc ctcgtcgttg gagggtctgc actctgggct gcgatggggt 9240 
ctggggctcc gcgctctggg ctgcgatgcg gtctggggct ccgcgctctg ggctgcgatg 9300 
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<400> 16 

tctctgcttc tatattcggc ctccaaatct gtgctcaatg cagcaactgg agtgacccct 60 
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taaatacgta agtcacagct tgcctttgtc 
gaagctgaag tcctcgtggt ggtccttaat 
cctcatgtgt ggccggtctc cctggatcat 
gaaactgcca gcattctccc acctccaggc 
ctcttccagc tgacgagctc atggcttgct 
gccaccttgg cggggctgtt cctcatcaat 
gacactcctg tccaacttgt ccactttgct 
aacgt:atgaa ccagtgaccc atcaggatcc 
cacaatgaac aatcagctct agaggtttaa 
acgagggcag ttaaggaaga aataaacagg 
agacctcatg ggagaaggtg tggttctccc 
cccagccaca gctggcccac ggtcagggca 
gtctggcaag caggaagcct ctctccccac 
tgcaagagtc actgagaacc cacaggtgca 
tgggggcggt cccctgaatt caatgtggtg 
ctgcca^t:tg cataggaaga gaaagaaaaa 
tcctggaccc atgctaggag gcgcttctcc 
caccaggtgc acaagagaag cgcctgcttg 
gaagggtacg tgtggagctg gaggcaagac 
tattgtgttc attttaagtc ccctgcacct 
tgtttcattg atcgatgtat: tccttgtgcc 
caaaaatcaa acataaaaat gaacctttat 
ggcatttcca agatttgtaa gtaacaattg 
tatctgttga aatgatgctt ctgagtggag 
ttttaagcat ttatgcttat tgtggttttt 
gattcccatg cagttgtaaa aagccacaca 
ctccagcccc aaccccagca atgacagacc 
aagaatgtcg tctattgcaa tcataaaatt 
catcattctc tggagattca tcccattgtt 
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agagctctcc agggtctttc actcagagca 120 
ccctacatgg cagttccacc cactccccag 180 
ttgctgtggc tgctctgctg tgtgttcccg 240 
tggcactgga tgctcctgcc acctggactc 300 
tccttcatgt cttaaattcg gtgtttgaat 360 
tcattt:aaag gacaaataac cccttgtcct: 420 
ttttccatag cactgatcac catttaaaat 480 
agagacaata gattgaacag ggattgcttg 540 
agagaaccac aaagaatggc tcaggattgc 600 
ggtggggatc ctttccacaa gtctgggttc 660 
aagggaagct ggagaagttt gctgggttgt 720 
gaggccagca ggcagggaaa tgtaggctgg 780 
ccaaggcagg tgggctgggg ctgggaagcc 84 0 
gatgccactg aatctcaata ggaagcca^c 900 
tgtgccgcca gacgtccccg acttgtgcca 960 
ggaagaaatg gaagcatctg gaaccagtca 1020 
ctacgcctca accaacaaag cttagcatlig 1080 
ctccagctcc attgcctcgg aaccggccat 1140 
attgatagct ggcactgcaa ttcacttatt 1200 
agaatataag ccccccgagc acaggacatt 1260 
ccaaagaatg agaggcatct agaaagtctg 1320 
tcagtcattg ttattttgat ggaaatttga 1380 
aacccttctg ctggttcatg tgtgggagtg 1440 
ttgctgagtc tttggctcta ggtttttttt 1500 
aaattaaaca tttaaccctg agacattgta 1560 
gagctatcat gtgtatcttc acctggcttg 1620 
tgttctccac tcctgaaatc tgctcattgc 1680 
gtgggattgg cttttttttt tcctgtgcag 1740 
gcatttatca atagtttatt ccattttact 1800 
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tctgagtagt 


gctctatggt 


atggatgtac 


cacagtctgt 


ttaactattc 


acctgttgga 


1860 


ggatgtctgt 


gtttatagat 


ttgggctatg 


acacatgtac 


aggtttttgc 


atggacat:ca 


1920 


gttttcattt 


ttctgggaca 


aaggcccagg 


ggttctattg 


cggggttcta 


tgcttgttgc 


1980 


agggtttttt 


tttttaaacc 


^gt:caagcca 


ttttccagaa 


actgtccagt 


ttccatgcat 


2040 


cctcaccagg 


cttcagtatg 


atcact;atga 


tcttatctca 


gccaccttaa 


taggtatgta 


2100 


ctgatatatc 


atggctttta 


tttgcatttc 


actgatgact 


aatggtgttg 


agcatctttt 


2160 


catgtgttta 


tttgccatct 


gtatatcctc 


t:ct:ag^caag 


tgtcccttca 


tgtcttttgt 


2220 


cracact:cca 


t^ucccgaaac 


ugcugaguuu 


t:gaaaaat:t:c 


uccacaaagc 


a^agaaac^a 


o o o r» 

2280 


_ X. 4» A. 4» 4. 4_ 

at:ucct:t:gi:t: 


gaatatg^ag 


uuugccaaca 


cnuucuutca 


gt^ctttggc^ 


4« 4> 4" 4> ^ a 

cgccuCCuca 




crctgct^aac 


agggccccwc 


acagagcaaa 


aggcuuCuac 


tit^gatgaag 


A. .m4> a^ ^ 4a ^ ^ >^ 

cctacrccaa 


2400 


caattr^ccc 


r^^cacggau 


M^4a«^4a^^^^M 

cacac^rrcg 


gtgacacatc 


taaaatct^cc 


tgacccagct 


2460 


ccatatccca 


aagatttccr 


ttctgttttc 


t:aaagcct:t:t: 


acagucccaa 


gttttatgtt 


2520 


taagtctatg 


atccattttg 


agttaatttt 


cttgcagggt 


gtgagaccaa 


ggttgtggtt 


2580 


cttctttttg 


tttggtggtt 


Ate .te.^. a»^» * — ^ 

ttgt:ct;gtgg 


acgtccagtt: 


aa'tccagccc 


atttgccaca 


2640 


aaagctatct 


tccattgaat 


tgcttttgca 


tctttgtaaa 


aacttaactg 


ggtatatgcg 


2700 


tgcaggtctg 


tttgagga^t: 


cttitiattgtc 


tgt:cccat^g 


atctatgcat: 


ctgtccatct 


2760 


gctagctiata 


taatgagtct 


tgaaagggtia 


gcctg^agc^ 


gggtatggtg 


gtgtgcatct: 


2820 


gtaatcccag 


ctacttggga 


ggcggaggca 


ggagaatcac 


'ttigaatctgg 


gaggtggagg 


2880 


ttgcaatgag 


tcgaga^tg^ 


gct:act:gcac 


^ccagcc^gg 


gtzgacagagc 


aagacbctgt 


2940 


ctctaaaaaa 


aagaaagaag 


aagaaaagga 


aagaaagggt 


agcctgat:t:c 


cccccacct:^ 


^ f\ f\ n 

3000 


attcttaaaa 


aaaaaagttt: 


^agcrat^tct: 


agrtccrti^g 


cccccccaua 


^aaatgt:tag 


3060 


aataatcttg 


tctatgtcta 


caaaaat:t:cc 


ctcrggaa^u 


ttgatagaaa 


c^gtgccaaa 


3120 


tctttatatt 


atttgagaga 


aatgacgctt 


ttattatgtt 


gagtctccta 


atccatggat 


3180 


atagcacatc 


tctccatttg 


tttagatctt 


ctttgattta 


ttttataatc 


attgcattat 


3240 


t:ttcagcat:a 


caaatccagc 


at:at:gggtt:g 


ttaaacttat 


gcctaggtat 


ctcttttttt 


3300 


tagccactat 


aagtagtatt 


gtgtttttaa 


gtttagggtc 


cgttactagt 


atgtagacac 


3360 


acaattgatc 


tttgtatatt 


tatcttgtat 


cctgcaacct 


tgctgaactc 


gcttaatagt 


3420 


tctaggaggt: 


gtattgtttt 


cttttgtttt 


gtttttcagt 


ttcttgggat 


tttctacaga 


3480 


gacaatcatg 


tcatctgcag 


atgcagacag 


ttttcttcct 


tcctttccaa 


tttgtatgtc 


3540 
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tttaatttcc 


tttttaaaaa 


acctttattg 


ctctgactag 


aactttctgt 


actatgttaa 


3600 


atacaagt:gg 


tgaaagtgga 


catcct^gcc 


ttgtccctga 


tgttaaggag 


aaagcgtttg 


3660 


t:aactgagta 


tcccagcctc 


aaaatg'tgct 


taaaaacttt 


tttcctttct 


tgctttcagc 


3720 


cttigaaacat: 


act:ticgaaac 


ucccrau^uc 


uCCCuCCCCC 


accaggcac^ 


tctgtgagca 


3780 


gugcucgcuu 


auCuaatzuac 


gtigcuuacuC 


agaaattcca 


ggggccaat^^ 


ttgaaacaaa 


3840 


ccaggcagag 


agacccagc^ 


gcagaa^ccti 


cccticttagg 


gggagtz'taca 


ggtagcct:ac 


o A A r\ 

3900 


cacttcccgg 


ct:gaaaticag 


gatgacticaa 


accagacctzc 


tzggacagacg 


attaatgact 


3960 


catgat:aacc 


attggaacaa 


gat:gcagacc 


aaca^cc^cc 


t:gcaccattc 


ccacatat'tt 


4020 


cccacacct:!: 


ttcctcctta 


aacccct;tcg 


ctcagtccag 


aaagt^t:tgaa 


tggtctttitia 


4080 


aaggcatggg 


gcctggccat 


tcctctactg 


ctagcatttg 


aataatgctg 


ctttcctttc 


4140 


accacact:t:c 


acttctcatg 


ccttgacttc 


tgagcagcga 


gcagct:ggac 


ttgagccagt 


4200 


tacacat:cag 


tctttcacca 


tgagaaatga 


tgttagccat 


aggttttttg 


tagatgctct 


4260 


ttgtcaagtt 


aaggaggttc 


tcttctattc 


ctacttttct 


gagagttgtt 


ttcctgaatg 


4320 


cgt:gat:gaa^ 


t^agccaagc 


. A> A» ^ ^ — ^ 

acutiuCuCug 


ca^^ga'tcga 


tsatgat.cat.g 


t:aarctcucu 


4380 


rccuaacata 


ct:aat:at:ggc 


rgatur^tga 


gtatiligtacc 


aggt:^t:ccac 


ccctiggaatia 


4440 


A f. <-i.4- fi> r-- 4— -i— -t— 4- 

aactigccc^t: 


ggtca^ggtzg 


t:agaa^^aat 


cctatarauc 


acca^tcgct 


aatatictcgc 


4500 


aaaggat:t:t:c 


t:gtacccata 


crcatgaggt 


acaccgrrct 


gcagctttcc 


tttttgtgtt 


4560 


gtcaggtttt 


ggttgggaga 


tattctctca 


tcttctgaga 


ttatgcagag 


ttggtgttat 


4620 


ttatttttta 


aatggttggt 


agaattttct 


aatgaaacca 


tatggacatg 


aagaattatt 


4680 


tttggaagct 


ttitaaaatita 


aaatgtt:aac 


tttaat:tgtc 


atagagctat 


taaagttatc 


4740 


tatcttatat 


tggcattgtg 


^cttttgaga 


aart:ggt:t:ca 


t:t:t:cacctat 


gttgtcaaat: 


4800 


at:at:g^ggga 


aggt:ct:ct:t:c 


gt:agt:at:tcc 


ct'tattia^cc 


tt:^ga^gt:ct: 


gcagggtctg 


4860 


cagtgatiagt 


ctctgttttg 


ct:ccagatgu 


cggccacrtg 


tgtctttctt 


tctttttttg 


4920 


tttgtcagtc 


tttctagaac 


tgcctcaatt 


ttattaattt 


ttccagagaa 


ctaacccttg 


4980 


tttcattgtt 


tttctctgtt 


gtttttctgc 


tttcgatttt 


ttctgctttc 


tgcttttgat 


5040 


ttattaattg 


ctgctcttat 


ctttgttatt 


tcttttcttc 


ttgctttggg 


tttattttgc 


5100 


tcttcttttt 


ctaggttctt 


gaagtgggag 


cttagatagt 


tgatttitgga 


cttctctttt 


5160 


ctaatatatg 


catttaatgc 


ctctcagcac 


tgatt:t:agct 


gtgtctcaca 


aattttgata 


5220 


tgtttttgtt 


tgtttgtttt 


tgaggtagag 


tctcgctctg 


ta^cccaggc 


tggagtgcag 


5280 
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tggcactatc ttggctcact gcaacctcca 
agccccctaa gtagctggga ttacaggtat 
atttattttt gtatttttag tagagatgag 
actcctgacc tcaagtgatc tgcccacgeg 
agccactgtg cccagcctgt ttttgttttt 
gctggagtgc agtggcatga tagcccactg 
tcctgcctca gcctcccgat tagctgggat 
ttttgcattt ttggtagaga tgggttttcg 
gatcgcaagt gatccacccg cctgggcctc 
tcacgcccag ctgatatgtt gtattttcat 
accttcaggc ttcctctttg acctgtggat 
gaagaaagat tttccattat ctttctggca 
agactaccct ctatatcatt taaattttta 
ggatatggtc tatcttggta tatattctgg 
tgccaggtgg tgtgttctac aaatgtcaat 
tctttgatgt ccctgctggt tttctgtcta 
caactataat tgtggctttt taaatttctc 
gcagctaatg tttggtgcac acacgtttag 
acttattatt gtataatttc cctctctgtt 
ctgttattga aataatgctt ctgctttctt 
tttttacttt caacctgtct ctattgttac 
tagttgtata atggctttta attcactttg 
ttacatttaa tataattatt aacatgctag 
acaaaatact accaactggg tggcttagaa 
cagaagtctg agatcaagtg agatttggaa 
tgttaccatt gtgggcaact gggactcagt 
gaaccatatt tgattgttcc acttagaagg 
ctatccctac agactgagga tgct:gat:tca 
ggaagcacag aagaaaaggt gcaggcactt 
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cctcctgggt tgaagtaatt ctcctgcttc 5340 
acgccaccat gcccagcaat ttatttattt 5400 
gttttgtcat gctgtccagg ctggtctcga 5460 
gggctccaaa gcactgagat tataggcata 5520 
tttgagatgg agtcttgctc tgtcacccag 5580 
caacct:ccgc ctcccgggtt caagtgatt:c 5640 
tacaggcgtg caccaccaca ctcagctagt 5700 
ccatgttggc caggctggtc tcgaattcct 5760 
ccaaagtgct ggaattatag gcacaagcca 5820 
tttcatccag cctagtatat ttttaaattt 5880 
tattcacagg tgtgttgttt ccaagcatct 5940 
ttgatttata gttagattcc atgtggtcag 6000 
aaaatttctt gaggctcatt ttctcatcca 6060 
tgcacttgaa aagaatgtgt gtagtgctgt 6120 
tcgattatgt taatitgatgg gtggccgagt 6180 
gttgctctga gagaagggta ttgaagtctc 6240 
ctttcagttc tgttttgctt cacatattgt 6300 
gattactatg tcttctttgc agaatggccc 6360 
aattagtctt tgttctaaag tctattttac 6420 
ttgattaatg tttatatatc ttttttcatg 6480 
atttgaagta agttitcttgt agacggcata 6540 
ccaatcactg tcatttaata tttaaaccat 6600 
agtttgtatt atttttatag ggttgctata 6660 
caaaaattta ttttctcaca ttctggtggc 6720 
ggtagaaaaa ccaacaaaat atgttaatga 6780 
ccttctigagg gccatctgag aaatagggtg 6840 
aagagtccag accatttatc ccatcagtta 6900 
cttgcacatc tgggtttcat cagtgtcagg 6960 
aaggtgggaa gctgtgaata cgtccgtgca 7020 
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ccaggaacga 


tctacaactg 


tggcaggtgg 


gccgacagcg 


tgggtcacca 


gtgccttcag 


7080 


ccaccccCtg 


cactgcac^g 


acccact:cac 


acagcaaat:c 


aagccca^cc 


cgcaactgat: 


7140 


gctt:cagca^ 


ggtggccagc 


caccgtctc^ 


gaaataat^t^a 


aaat^aggligg 


"ttiggtggcac 


7200 


aggcga'tgg't 


ccctactigt^g 


cag^tggtct 


ugcagcccua 


actgaga'ttc 


at^cg'baagct 




cccactcligc 


t^cct^tcttgg 


cgcgccucag 


ccccagccag 


0m ^ 0m ^ ^* 0m 0m^ 0m^^ 

cacaugcccc 


ggtic^aggt^g 


"7 O O A 


Cucguucggc 


gg'tgccatic^ 


aaaccuccuu 


augcccagg u 


gucgagcaaa 


gcccagacac 


"7 o Q 


t^g'tccac'ttc 


agtgaagcac 


c'taggaa^'ba 


gcagcccuga 


aaagcug uga 


'tcactgtgag 


/ 4 4 U 


attcaaagaa 


aagggtcgtg 


agggaagtgg 


tigagagagaa 


agttgtg^gg 


t^agcggcagc 




ccaacaggag 


ccacca'bcag 


aaggaacaca 


gcca^ccaga 


gaagtgcccc 


aggccacaaa 


75o0 


gcactggggg 


ccagagatct 


cacccctca't 


gtctgccatg 


ggttigacccc 


caacctccag 


7620 


ccctaccatic 


'bcct^gacgg't 


gtctgcacca 


gt^t^gaaccca 


accagtia^ct 


aaaaggacac 


7680 


ag^^ggcgaa 


tgagactggg 


acacagggca 


aga'bggg'tgg 


a'tga^gggag 


actcc^ggag 




agcacccgtc 


gcactzgagcg 


ti^ggacctcat^ 


gggagagccc 


tgttctctga 


agcatctgtg 


•7 o A 


catigtcg^tc 


cagca'tt't^c 


^^caaggatzt 


gagccagcag 


caccagugu u 


g'baaggtgc't 


/ODU 


tagat^caatig 


at'tcacaaac 


aaccaatigaa 


a uacgaggcg 


0m 0m 0m 0m 0m 0m ^ 

cccgggguac 


agtcaacaaa 




cacagagaac 


agagaaacct 


tcccgccgau 


g^agagactc 


cagcctgt'tti 


gcccaucccc 


n O O A 


ggtcctgaag 


agcccaggcc 




c^gcccgggg 


ggatgaggg^ 


ggggggtttc 


8040 


tgcttggcag 


cacttgccgt 


gggaggggtg 


agggactggg 


tcacgccagc 


ccgttcgtta 


8100 


cagccccagg 


g^t:t:a^t:aga 


gcgugcaura 


gtiaccauuga 


gtaagliactit^ 


gagagt;gtct: 


ol60 


gatct:tgggc 


cagagaggca 


caaagatgcc 


a^t^gtgtggg 


t:ccagcaccti 


gcctgcagag 


O O O A 

o220 


cgtgggtcag 


ccktgggticc 


cagggaagat 


gacacacacc 


^gggaaatigc 


agggt^ccggg 


o o o n 

o2o0 


agggagaagg 


caaag^tc^g 


gctcagg't^g 


gccggggacg 


aggccagcag 


agccagg'tgc 




ccaagggacc 


ticagccacga 


act^ctgagca 


caggctiggca 


ggtgacticlili 


ggtigcc^cat: 


O >l A A 


gcgacttgtt 


tatctaaagg 


gatgagattc 


aaggcctgtc 


ctgggggctg 


ggggccgtca 


8460 


aagctgacga 


gagaggggaa 


tgtatattct 


aacagggaga 


tggtcgatga 


atacgtgcag 


8520 


gaagaaat:gg 


acaggacaat 


ccagagagat 


cgcgtgttct 


gaggacagca 


cagccaggct 


8580 


ccggtacgga 


gtgaagcggg 


gtcggggagg 


cggcggggtc 


cctcatatgg 


cccgaggagg 


8640 


ccgtatataa 


actgaccctg 


agccacaaaa 


tagtgccctc 


ctctgcccct 


aggaagctcg 


8700 


agtgcagggt 


ccaggtgggg 


aaaat:caatg 


cagagtgggt: 


cccagagtgg 


gcggaagctt 


8760 
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gcgt^gcggga 


cticagc^ggc 


agcagcccca 


cgcccccccg 


g'ttctaaagc 


8820 




^ ^ ^ ^ a n 


a ft ft ft ^ ft a 4* ft ft 

dgggoga ugg 


ccaguccccc 


agaggac^tg 


cccagggtcc 


o o o 
OOOU 






^ ftf*Aftfrf9fvt' 4" 

wgcaggggi. u 


ggcgagggag 


ua ucccgagg 


c^gtgggccc 


Q Oil A 


^ /^■^ <T 




oa na 4" ^/Ya ^a 


ccd ccc ugcc 


^«4~ f^f^^ f* 

cuguccuCwC 


gagticctic^g 


7UUU 




ag ugggcgcg 




gwdddCucug 


a ^ ftftfm a 4^ f^fw 

gauggca ucg 


ugugccuuCu 








4" ^^^^4" ^ ^a 

uugcug uucd 


ff^iA ^a 4~ nf*f*i> 
CCd^d u^^w-d 


ft ^ a a ^ s ft ft a 

gcaaugagga 


cac^ccccc^ 








f*f^st /*^a ^ fyftfT 


ft ft ft ft ^ ft 

gdgggg ugcd 




'bgctzcccagg 




a a 


n n n ft f^'^ a 4" a 

gggggcL.a uo. 


aa^aa<^a4"/^+' 
ddgddwd I.C u 


^ft a /T a ft ft a ft f* 

cgdgdggagc 


cagcdcagcc 


't'tg'b'tcagac 






cugccgagg u 


o^/Y^a ^i**a /^a 
c^^Cd^wdCd 


^ra ft ^^4" ft ft a 

gcigcucuggd 


gd ugaagacc 


ctigtlicc^gg 






cggccuggcc 


g wugccc 1-g u 


^i^^^^ ^ A 

ccuucacccu 


ggaggaggag 


gatgtgagct 




,^v^v/v^ 4* #v 4* 


gggcggacgg 


aggagccagg 


cggacucccg 


ggcagggggc 


ag tg ccaggg 


9420 


y cccuy CI. uU> 


A ft ft a ^v^v4* ^^4* ^ 

aggagguguc 


dCugaaggcip 


ggcuuCugac 


cccgcgcccc 


cagcctigggg 


o >i o n 


cggcggcgga 


gggguccua u 


^ +* ^ ^» ^ 

ugu uccucco 


gcagacacgg 


ccccccgagg 


cccagggccg 


yD4 u 


gcigca.ggcuc 


g uc ucagggg 


4* ^^^^^ ^v^^ 4" ^v^^ 

u uccugcugc 


ac ugacgccu 


gaagcccgaa 


ggt^ctcgcag 


O £ A A 


gguugggccc 


^ ftft^ ft ft ft a 

ug wggaggga 


ft ft f^ 4* ^ a ^ ^ 

gggcucaccu 


^v^r^ ft ft ft fm ft 

ggcgccgggg 


^f^^ftftftftft^ fm 
cccgggggcc 


catggggCgc 




agACal^gCCC 




g^TOQcuggg 


a ^<r^^ ^^^^ ^va ftf* 

dgcccugdgc 


a ft ft ft ft ft f*^ ft ft 

sgggg^ccgg 


ckctaactca 






^^4" /■•4" a a 
gc uCuaawCa 


a ftft^ ftf*^ ftft^ 

agg ugcaggd 


a ^*a ft^^^ ft 

dCaCdgccug 


^ ^ 4* ^ 4* a 9 ft ft ft 

ccuuuaaggg 


cagcagccgg 


OTP A 
7 /OU 


A 4^ ^ ^ ^ 

gcaccacggg 


4* ft^ f 4" ^^4^ 4* 9 

ug ucugguua 


A ft ft f* ^ ft ft 
uagcugcagg 


ccugagugcc 


aggg ucagag 


tiagaa tctigg 


Q o y| A 


gcc2LCCcH tg 


gugggcucac 


ggcct^t^ggcc 


ugcuccagau 


cacagggacc 


t:gg^acg^ga 


OO A A 

9900 


aggccatggt 


ggtcgatzaag 


gaclit^tccgg 


aggacaggag 


gcccaggaag 


gtgticcccag 


9960 


tgaaggtzgac 


agcccugggc 


ggtgggaagt 


^ggaagccac 


gt^tcaccC^c 


atigtigag^gt: 


T A A O ft 

10020 


4* ^ ^^^^ ^^^^ 

ugccc3.ci.gc 


agggccccuc 


aggccact^^ 


cgc^cccctc 


cccaga ccca 


cctgg1:gccc 


1 A A O ft 

lOOoO 


atztgccccati 


cca cgti 't eg 


ggtgttggga 


agagticaccc 


cctgccttgg 


agggaaacag 


10140 


cctgggcatc 


ctgaagctcg 


gtggggtggg 


ggacagtgga 


attttcaggt 


tgccgggtca 


10200 


gggccatgca 


ccaggtgagc 


tgaggatggg 


ccatgggtgt 


cctgggagcc 


gctgcccgcg 


10260 


tgtctcctgt 


tttccaggag 


ggaggatcgg 


tgcatccaga 


agaaaatcct 


gatgcggaag 


10320 


acggaggagc 


ctggcaaata 


cagcgcctgt 


gagcccctcc 


cccactccca 


cccccaccct 


10380 


cccccaccgc 


caaccccagt 


gcaccagcct 


ccacaggtag 


agagtgccca 


ggctgccctt 


10440 


ttgccagggc 


cccagctctg 


cccacctcca 


aggaggggct 


ggcctctcct 


tcctgggggg 


10500 
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^a ^a ^a 

V..^ o v.^cl l« Cd.^ a. 




ctA r*artdr*t t 

\jCI WOiVj^i^ L> L.^ 


i^w^ 


a ^ra t frf^st r*r^a 
d^ d ^ d wwd 


1 ns^n 


^ d Cd U 


^^OwL.^ ^^^^ 


dUU L»Cl^ 




i> C>^d^^ddU ^ 








i^^aacrcra^^a 






t a nrttiA t rmn 


oa ao/^t^raoo 

^dd^WLt^d^^ 


1 0680 




n rrrr a a cr t" rr a 


frdcrttaacma 


tooooaooct 


oaooot taoo 
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catgtcctcc catgtccccc gcattcccca tgtgccccga gtctcctcgc aggggctccc 12300 
gggccctgtt tagcgtcctc ctcattggag gctctgtgct ctgggctgcg atggggtctg 12360 
gggctccgcg ctctgggctg cgatggggtc tggggctccg cactctgggc tgcgatgggg 12420 
tctggggctc cgcgctctgg gctgcgatgg gctctggggc tctgagctct gggctgtgat 12480 
ggggtctggg ccctggtcta gggcgccttc taatccctgg gtttttcttg gtctctgcag 12540 
gaagctgcgt tcccgaacac tagggtgagt gagcctttag gagggcactg gacaagccca 12600 
gagtcctggg ttcccggggt tcgagggtac atctgctctg gcccctccca tcccacacag 12660 
ccagggagac ccccccaggg tcaggcacga ggttggcacc tcagagtctg cccacccaca 12720 
gttcctggga cattcgggaa gtcctttgtt ttatcattcc tgcacctgcc agcccgagtg 12780 
agggtcctcc tcggcctttc cacagcgagg cctccctccg gctccctcag gtgtcagctc 12840 
agcccatcgc cccctgcacc tgtccccacg cggtccactc cccaccatcc acccaccaag 12900 
gatgctcaga ggcctgccca gtcattggag gagctgaggt cgctctggag ccccgaggtt 12960 
gcccagcagt ggccgatgtg ggggctgcag agcctgggga gggagctctg gccctggcct 13020 
ctgccctacc ctgcagcctc cctgacctct gctcctcttc ccagcacagc agcccccggg 13080 
tctgcacctc cagagcccac cctaccacca gacacagagc ccggaccacc tggacctacc 13140 
ctccagccat gacccttccc tgctcccacc cacctgactc caaataaagt ccttctcccc 13200 
cagctctggg caggcctatc tgtggggaca gaggggcttg cacccgctcc ctgggaggtc 13260 
tgctgggagg gggagccaca agggaagctg gggagatgtt ggacctagca agggccaaac 13320 
cacaagaggc acgatgtcca acaggcctga ggggctgcgt gatgtcctgg aggggcctcc 13380 
ggaagagccg ccctcaggtc tcaggttcag cttaggacag gcagggccct gggcaggagc 13440 
gtttggaaag ccactgggga ggacaggagc ggggacacgg cgtcagggct gcagcagtgg 13500 
ggccaccgca gggctcccgc ctcaggggtc tcagagggat cctccaagct cccccatttt 13560 
agcagcctgg gctcagtggc agcactggag a 13591 
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